Модифікований метод острівної кластеризації природномовних текстових даних
dc.contributor.advisor | Заболотня, Тетяна Миколаївна | |
dc.contributor.author | Юсин, Яків Олексійович | |
dc.date.accessioned | 2018-06-25T22:27:15Z | |
dc.date.available | 2018-06-25T22:27:15Z | |
dc.date.issued | 2018 | |
dc.description.abstractuk | У даній магістерській дисертації було представлено дослідження на тему кластеризації природномовних текстових даних. У роботі розглянуто постановку задачі кластеризації, проаналізовано найбільш популярні існуючі методи кластеризації текстових корпусів та на основі результатів цього аналізу обрано метод острівної кластеризації для подальшого вдосконалення. На основі цього запропоновано нові підходи до попереднього оброблення графу сумісної зустрічальності термів (глобальний, відсотковий, ефективного опору та відмова від оброблення) в методі острівної кластеризації; запропоновано та проаналізовано використання методу k medoids для кластеризації отриманого після оброблення наближення графу; запропоновано модифікований метод кластеризації природномовних текстових даних та його різновиди, які відрізняються використовуваними підходами до оброблення графу сумісної зустрічальності термів та до вибору кількості кластерів. Також в рамках даної роботи розроблено програмне забезпечення для автоматичної кластеризації текстів, що використовує запропонований метод, та наведено практичні результати його застосування. | uk |
dc.format.page | 103 с. | uk |
dc.identifier.citation | Юсин, Я. О. Модифікований метод острівної кластеризації природномовних текстових даних : магістерська дис. : 121 Інженерія програмного забезпечення / Юсин Яків Олексійович. – Київ, 2018. – 103 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/23660 | |
dc.language.iso | uk | uk |
dc.publisher.place | Київ | uk |
dc.subject | кластеризація | uk |
dc.subject | природномовні текстові дані | uk |
dc.subject | острівна кластеризація | uk |
dc.subject | k medoids | uk |
dc.subject | кластеризація графу | uk |
dc.subject.udc | 004.91 | uk |
dc.title | Модифікований метод острівної кластеризації природномовних текстових даних | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Yusyn_magistr.pdf
- Розмір:
- 1.66 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.74 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: