Виявлення нечітких дублікатів текстових даних з використанням модифікованого коефіцієнта Cosine Similarity
dc.contributor.author | Заболотня, Т. М. | |
dc.contributor.author | Козинець, Н. В. | |
dc.date.accessioned | 2024-12-10T08:59:46Z | |
dc.date.available | 2024-12-10T08:59:46Z | |
dc.date.issued | 2024 | |
dc.description.abstractother | The paper addresses detecting fuzzy duplicates in text data using a modified cosine similarity measure. It examines existing challenges in identifying duplicates across diverse text formats and proposes enhancements, including adaptive weighting and contextual embeddings, to improve detection accuracy. The suggested modifications demonstrate increased precision in identifying fuzzy duplicates, particularly in complex text corpora. | |
dc.format.pagerange | С. 110-115 | |
dc.identifier.citation | Заболотня, Т. М. Виявлення нечітких дублікатів текстових даних з використанням модифікованого коефіцієнта Cosine Similarity / Заболотня Т. М., Козинець Н. В. // Прикладна математика та комп’ютинг ПМК' 2024 : збірник тез доповідей Сімнадцятої конференції магістрантів та аспірантів (20-22 листопада 2024 р. Київ, Україна). – Київ, 2024. – С. 110-115. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/71099 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.source | Прикладна математика та комп’ютинг ПМК' 2024 : збірник тез доповідей Сімнадцятої конференції магістрантів та аспірантів (20-22 листопада 2024 р. Київ, Україна) | |
dc.subject.udc | 004.91 | |
dc.title | Виявлення нечітких дублікатів текстових даних з використанням модифікованого коефіцієнта Cosine Similarity | |
dc.title.alternative | Detecting fuzzy duplicates in text data using a modified cosine similarity measure | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: