Заболотня, Тетяна МиколаївнаПастушенко, Андрій Сергійович2018-06-252018-06-252018Пастушенко, А. С. Модифікований I-Match метод виявлення нечітких дублікатів в текстових даних : магістерська дис. : 121 Інженерія програмного забезпечення / Пастушенко Андрій Сергійович. – Київ, 2018. – 100 с.https://ela.kpi.ua/handle/123456789/23657Дана дисертація присвячена обробці природномовних текстових даних та, зокрема, розробленню методу пошуку нечітких дублікатів в текстових даних. У роботі було досліджено існуючі аналоги в області визначення нечітких дублікатів та проведено порівняльний аналіз існуючих програмних комплексів, що реалізують можливість пошуку дублікатів. Було проаналізовано переваги та недоліки існуючих методів, після чого було сформульовано відповідні гіпотези щодо можливості модифікації. На основі даних гіпотез було сформульовано модифікаований метод визначення нечітких дублікатів на основі методу I-Match. На основі проведеного дослідження було обрано засоби реалізації методу та реалізовано модифікований метод пошуку нечітких дублікатів. У даній дисертації виконано оцінку ефективності запропонованого методу та надано шляхи подальшого вдосконалення.ukМодифікований I-Match метод виявлення нечітких дублікатів в текстових данихMaster Thesis100 с.004.91