Дослідження моделі фрагментів програмного коду на предмет плагіату
Завантажити презентаціюПрезентація по слайдам:
Дослідження моделі фрагментів програмного коду на предмет плагіату Виконав: студент гр. ІК-53 Доля В. А.
Мета роботи Дослідження існуючих методів та алгоритмів ідентифікації плагіату фрагментів програмного коду та їх реалізацій Підвищення ефективності пошуку плагіату фрагментів програмного коду за допомогою оптимізації методу ідентифікаційних міток
Задачі для досягнення поставленої мети Аналіз і порівняння існуючих систем автоматичного пошуку плагіату у фрагментах програмного коду, а також методів та алгоритмів, що використовуються ними. Розробка алгоритму для перевірки на плагіат заданого фрагменту програмного коду з використанням бази існуючих фрагментів. Алгоритм повинен забезбечувати надійність перевірки, виявляти текстовий плагіат з модифікаціями та мати високу швидкодію(працювати за лінійний час). Проведення експериментальних досліджень розробленого алгоритму та порівняння його ефективності з існуючими.
Методи дослідження У ході дослідження були використані моделі і методи теорії множин, статистичного аналізу, теорія нейронних мереж, теорія графів, а також методи, пов'язані з такими галузями знань як Information Retrieval та Text Mining. При реалізації експериментальних досліджень розроблених алгоритмів був застосований ряд методів об'єктно-орієнтованого проектування та програмування.
Види представлення програмного коду У вигляді елемента «n-вимірного» простору У вигляді звичайного тексту Токенізоване представлення
Алгоритми пошуку плагіату Алгоритм Хескела Жадібне строкове заміщення Метод концептуального графу Метод пошуку на XML представленні Метод ідентифікаційних міток
Вимоги до критеріїв схожості Повинні представляти такі характеристики, які досить важко змінити, намагаючись замаскувати копію. Повинні бути стійкі до незначних змін програмного коду. Повинно бути просто порівнювати використовуючи ці метрики. Повинні бути досить загальними (щоб могли бути застосовними щодо достатньо широкого ряду мов програмування)
Типи плагіату програмного коду Текстова подібність Два окремих програмних кода можуть бути подібними на основі їх текстового змісту. Під текстовим змістом маються на увазі слова, літери, імена змінних, і т.д. кодів. Функціональна подібність Функціональна подібність Функціональна подібність це подібність між результатом виконання двох або більше фрагментів коду. Подібності цього типу зазвичай не є скопійованими фрагментами з оригіналу.
Схожі презентації
Категорії