Кластеризація документів на основі статистичної близькості термів

dc.contributor.authorАмонс, О. А.
dc.contributor.authorЯнов, Ю. О.
dc.contributor.authorБезпалий, І. О.
dc.date.accessioned2013-11-27T13:29:42Z
dc.date.available2013-11-27T13:29:42Z
dc.date.issued2008
dc.description.abstractenIn the given work the approach to clustering of documents collections with unknown quantity of clusters is described. A method of finding matrix of similarity is improved. The method is based on the statistics of key terms occurrence in documents. For quality analysis and finding of limiting values of algorithm, there was used a function of competitive similarity improving. The approach is realized as the application server SmartBase’s application. Implementation details and results of the process are shown. Russian text set is used.uk
dc.description.abstractukУ статті описано підхід до кластеризації колекції документів з невідомою наперед кількістю кластерів. В основу підходу покладено метод, оснований на статистиці появи ключових термів. Запропоновано модифікацію методу знаходження матриці подібності на основі схожості косинуса. Для аналізу якості й знаходження граничних значень алгоритму використана модифікація функції конкурентної подібності. Підхід реалізований у вигляді прикладного застосування сервера SmartBase. Наведені результати експериментальних досліджень запропонованого підходу до кластеризації інформації з використанням часто вживаного текстового корпусу підтверджують працездатність запропонованих рішень.uk
dc.format.pagerangeС. 55-62uk
dc.identifier.citationАмонс О. А. Кластеризація документів на основі статистичної близькості термів / О. А. Амонс, Ю. О. Янов, І. О. Безпалий // Вісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка : збірник наукових праць. – 2008. – № 49. – С. 55–62. – Бібліогр.: 11 назв.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/6114
dc.language.isoukuk
dc.publisherВек+uk
dc.publisher.placeКиївuk
dc.sourceВісник НТУУ «КПІ». Інформатика, управління та обчислювальна техніка: збірник наукових працьuk
dc.source.nameВісник НТУУ «КПІ». Інформатика, управління та обчислювальна технікаuk
dc.status.pubpublisheduk
dc.subject.udc004.93(015.7)uk
dc.titleКластеризація документів на основі статистичної близькості термівuk
dc.typeArticleuk
thesis.degree.level-uk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
49_09.pdf
Розмір:
305.68 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: