Метод виявлення нечітких дублікатів текстових документів

dc.contributor.authorЧумак, М. С.
dc.contributor.authorЗаболотня, Т. М.
dc.date.accessioned2023-05-26T12:25:20Z
dc.date.available2023-05-26T12:25:20Z
dc.date.issued2022
dc.description.abstractЗ розвитком технологій обміну інформацією, зокрема мережі Інтернет, виникла та стрімко поширилась проблема незаконного запозичення текстових даних різних форматів. Звісно, використання копій дозволяється безкоштовно за умови, що вони не створюються та не розповсюджуються з метою отримання прибутку чи комерційної вигоди, і обов’язково містять посилання на першоджерело. Але численні порушення вищезазначених принципів стали причиною зростання необхідності розроблення методів та відповідних програмних засобів для виявлення нечітких дублікатів текстів. Вирішення цієї задачі є вкрай актуальним і для представників сучасного бізнесу.uk
dc.description.abstractotherThis work is devoted to the method for detecting fuzzy duplicates of text documents. The detection of near-duplicate documents is an important problem and difficult task in many data mining and information filtering applications. When faced with massive quantities of data, traditional duplicate detection techniques relying on direct inter-document similarity computation are often not efficient enough. In this work, the existing methods for detecting fuzzy duplicates of text documents will be considered. As a result, a hypothesis for improving already existing methods will be proposed.uk
dc.format.pagerangeС. 493-498uk
dc.identifier.citationЧумак, М. С. Метод виявлення нечітких дублікатів текстових документів / Чумак М. С., Заболотня Т. М. // Прикладна математика та комп’ютинг ПМК' 2022. П'ятнадцята конференція магістрантів та аспірантів Київ, 16-18 листопада 2022 р. : збірник тез доповідей. - Київ : КПІ ім. Ігоря Сікорського, 2022. - С. 493-498.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/56222
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofПрикладна математика та комп’ютинг ПМК' 2022. П'ятнадцята конференція магістрантів та аспірантів Київ, 16-18 листопада 2022 р. : збірник тез доповідейuk
dc.subject.udc004.912uk
dc.titleМетод виявлення нечітких дублікатів текстових документівuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
PZKS-Chumak_Zabolotnia_P493-498.docx
Розмір:
40.73 KB
Формат:
Microsoft Word XML
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: