Комбінований метод виявлення нечітких дублікатів текстових документів
dc.contributor.author | Сєчин, І. Я. | |
dc.contributor.author | Дрозденко, Л. В. | |
dc.contributor.author | Заболотня, Т. М. | |
dc.date.accessioned | 2024-03-06T14:07:54Z | |
dc.date.available | 2024-03-06T14:07:54Z | |
dc.date.issued | 2023 | |
dc.description.abstractother | The paper proposes a combined method for automated detection of fuzzy duplicates in textual documents with the aim of enhancing accuracy while maintaining processing speed. Comparative analysis is conducted on existing methods such as Jaccard, TF-IDF, Doc2Vec, Universal Sentence Encoder (USE), and Bidirectional Encoder Representations from Transformers (BERT). The proposed method involves preprocessing text, vectorization, similarity measurement and clustering and ranking in the final stages. The integration of machine learning elements alongside traditional methods is expected to improve the accuracy and adaptability of the approach in identifying similar textual fragments. | |
dc.format.pagerange | С. 600-605 | |
dc.identifier.citation | Сєчин, І. Я. Комбінований метод виявлення нечітких дублікатів текстових документів / Сєчин І. Я., Дрозденко Л. В., Заболотня Т. М. // Прикладна математика та комп’ютинг ПМК' 2023 : збірник тез доповідей Шістнадцятої конференції магістрантів та аспірантів (28-30 листопада 2023 р. Київ, Україна). - Київ : КПІ ім. Ігоря Сікорського, 2023. - С. 600-605. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/65250 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.relation.ispartof | Прикладна математика та комп’ютинг ПМК' 2023 : збірник тез доповідей Шістнадцятої конференції магістрантів та аспірантів (28-30 листопада 2023 р. Київ, Україна) | |
dc.title | Комбінований метод виявлення нечітких дублікатів текстових документів | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: