Кластеризація документів на основі статистичної близькості термів
dc.contributor.author | Амонс, О. А. | |
dc.contributor.author | Янов, Ю. О. | |
dc.contributor.author | Безпалий, І. О. | |
dc.date.accessioned | 2013-11-27T13:29:42Z | |
dc.date.available | 2013-11-27T13:29:42Z | |
dc.date.issued | 2008 | |
dc.description.abstracten | In the given work the approach to clustering of documents collections with unknown quantity of clusters is described. A method of finding matrix of similarity is improved. The method is based on the statistics of key terms occurrence in documents. For quality analysis and finding of limiting values of algorithm, there was used a function of competitive similarity improving. The approach is realized as the application server SmartBase’s application. Implementation details and results of the process are shown. Russian text set is used. | uk |
dc.description.abstractuk | У статті описано підхід до кластеризації колекції документів з невідомою наперед кількістю кластерів. В основу підходу покладено метод, оснований на статистиці появи ключових термів. Запропоновано модифікацію методу знаходження матриці подібності на основі схожості косинуса. Для аналізу якості й знаходження граничних значень алгоритму використана модифікація функції конкурентної подібності. Підхід реалізований у вигляді прикладного застосування сервера SmartBase. Наведені результати експериментальних досліджень запропонованого підходу до кластеризації інформації з використанням часто вживаного текстового корпусу підтверджують працездатність запропонованих рішень. | uk |
dc.format.pagerange | С. 55-62 | uk |
dc.identifier.citation | Амонс О. А. Кластеризація документів на основі статистичної близькості термів / О. А. Амонс, Ю. О. Янов, І. О. Безпалий // Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка : збірник наукових праць. – 2008. – № 49. – С. 55–62. – Бібліогр.: 11 назв. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/6114 | |
dc.language.iso | uk | uk |
dc.publisher | Век+ | uk |
dc.publisher.place | Київ | uk |
dc.source | Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка: збірник наукових праць | uk |
dc.source.name | Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка | uk |
dc.status.pub | published | uk |
dc.subject.udc | 004.93(015.7) | uk |
dc.title | Кластеризація документів на основі статистичної близькості термів | uk |
dc.type | Article | uk |
thesis.degree.level | - | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: