Метод виявлення нечітких дублікатів текстових документів
dc.contributor.author | Чумак, М. С. | |
dc.contributor.author | Заболотня, Т. М. | |
dc.date.accessioned | 2023-05-26T12:25:20Z | |
dc.date.available | 2023-05-26T12:25:20Z | |
dc.date.issued | 2022 | |
dc.description.abstract | З розвитком технологій обміну інформацією, зокрема мережі Інтернет, виникла та стрімко поширилась проблема незаконного запозичення текстових даних різних форматів. Звісно, використання копій дозволяється безкоштовно за умови, що вони не створюються та не розповсюджуються з метою отримання прибутку чи комерційної вигоди, і обов’язково містять посилання на першоджерело. Але численні порушення вищезазначених принципів стали причиною зростання необхідності розроблення методів та відповідних програмних засобів для виявлення нечітких дублікатів текстів. Вирішення цієї задачі є вкрай актуальним і для представників сучасного бізнесу. | uk |
dc.description.abstractother | This work is devoted to the method for detecting fuzzy duplicates of text documents. The detection of near-duplicate documents is an important problem and difficult task in many data mining and information filtering applications. When faced with massive quantities of data, traditional duplicate detection techniques relying on direct inter-document similarity computation are often not efficient enough. In this work, the existing methods for detecting fuzzy duplicates of text documents will be considered. As a result, a hypothesis for improving already existing methods will be proposed. | uk |
dc.format.pagerange | С. 493-498 | uk |
dc.identifier.citation | Чумак, М. С. Метод виявлення нечітких дублікатів текстових документів / Чумак М. С., Заболотня Т. М. // Прикладна математика та комп’ютинг ПМК' 2022. П'ятнадцята конференція магістрантів та аспірантів Київ, 16-18 листопада 2022 р. : збірник тез доповідей. - Київ : КПІ ім. Ігоря Сікорського, 2022. - С. 493-498. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/56222 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.relation.ispartof | Прикладна математика та комп’ютинг ПМК' 2022. П'ятнадцята конференція магістрантів та аспірантів Київ, 16-18 листопада 2022 р. : збірник тез доповідей | uk |
dc.subject.udc | 004.912 | uk |
dc.title | Метод виявлення нечітких дублікатів текстових документів | uk |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- PZKS-Chumak_Zabolotnia_P493-498.docx
- Розмір:
- 40.73 KB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: