Модифікований I-Match метод виявлення нечітких дублікатів в текстових даних

Вантажиться...
Ескіз

Дата

2018

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Дана дисертація присвячена обробці природномовних текстових даних та, зокрема, розробленню методу пошуку нечітких дублікатів в текстових даних. У роботі було досліджено існуючі аналоги в області визначення нечітких дублікатів та проведено порівняльний аналіз існуючих програмних комплексів, що реалізують можливість пошуку дублікатів. Було проаналізовано переваги та недоліки існуючих методів, після чого було сформульовано відповідні гіпотези щодо можливості модифікації. На основі даних гіпотез було сформульовано модифікаований метод визначення нечітких дублікатів на основі методу I-Match. На основі проведеного дослідження було обрано засоби реалізації методу та реалізовано модифікований метод пошуку нечітких дублікатів. У даній дисертації виконано оцінку ефективності запропонованого методу та надано шляхи подальшого вдосконалення.

Опис

Ключові слова

Бібліографічний опис

Пастушенко, А. С. Модифікований I-Match метод виявлення нечітких дублікатів в текстових даних : магістерська дис. : 121 Інженерія програмного забезпечення / Пастушенко Андрій Сергійович. – Київ, 2018. – 100 с.

DOI