Модифікований I-Match метод виявлення нечітких дублікатів в текстових даних
Вантажиться...
Дата
2018
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Дана дисертація присвячена обробці природномовних текстових даних та, зокрема, розробленню методу пошуку нечітких дублікатів в текстових даних.
У роботі було досліджено існуючі аналоги в області визначення нечітких дублікатів та проведено порівняльний аналіз існуючих програмних комплексів, що реалізують можливість пошуку дублікатів. Було проаналізовано переваги та недоліки існуючих методів, після чого було сформульовано відповідні гіпотези щодо можливості модифікації. На основі даних гіпотез було сформульовано модифікаований метод визначення нечітких дублікатів на основі методу I-Match. На основі проведеного дослідження було обрано засоби реалізації методу та реалізовано модифікований метод пошуку нечітких дублікатів.
У даній дисертації виконано оцінку ефективності запропонованого методу та надано шляхи подальшого вдосконалення.
Опис
Ключові слова
Бібліографічний опис
Пастушенко, А. С. Модифікований I-Match метод виявлення нечітких дублікатів в текстових даних : магістерська дис. : 121 Інженерія програмного забезпечення / Пастушенко Андрій Сергійович. – Київ, 2018. – 100 с.