Метод нечітких k-середніх з обмеженою масою робочої області формування кластерів довільної форми
dc.contributor.author | Настенко, Євген Арнольдович | |
dc.contributor.author | Уманець, В. С. | |
dc.date.accessioned | 2020-05-20T11:33:13Z | |
dc.date.available | 2020-05-20T11:33:13Z | |
dc.date.issued | 2018 | |
dc.description.abstracten | The task of determining the functional connection between biophysical indicators is an integral part of the solution of an actual problem of searching for optimal effects on a biological object and has not been fully solved to date. One of the important tasks in this area is the division of the feature space into regions (clusters), which relate to various functional relationships linking biophysical indicators, the desired clusters can have an arbitrary shape. Such clusters will be called functional, and the task is to develop a method for extracting clusters of arbitrary shape from the initial sample. To solve this problem, the paper considers a fuzzy version of clustering for the algorithm of k-means with a limited mass of the working region for clusters’ formation. The estimation of number of clusters is carried out according to the histogram of frequencies, to determine the optimum number of columns of the histogram, the application of the Scott formula is justified. The algorithm allows forming clusters of arbitrary configuration and obtaining the value of the object's membership function value for each of the clusters. The efficiency of the algorithm is demonstrated by the example of clustering the Iris Fisher data set. Comparative testing was carried out: classical k-means algorithm, Ward's method and developed algorithm. Obtained results made it possible to give preference to the problems of analyzing clusters of an arbitrary shape developed in this paper, a version of fuzzy k-means with a limited mass of the working region for the formation of clusters. Membership function calculation allows obtaining additional information on the clusters’ formation structure, as well as making corrections to the result of clustering of k-means with a limited mass, which is especially important for algorithms that receive the result of clustering in a single pass. Concerning the comparison of the qualitative results of the developed algorithm and the Ward algorithm, it should be noted that developed algorithm has low computational cost since it does not require additional memory to store the distance matrix and time for its recalculation. In addition, developed algorithm has no problems associated with cutting the dendrogram to obtain clusters. | en |
dc.description.abstractru | Задача определения функциональной связи между биофизическими показателями является составной частью решения актуальной проблемы поиска оптимальных воздействий на биологический объект и не решена в полной мере в настоящее время. Одной из важных задач в этой области является разбиение пространства признаков на области (кластеры), которые относятся к различным функциональным соотношениям, связывающим биофизические показатели, искомые кластеры при этом могут, иметь произвольную форму. Такие кластеры назовем функциональными, в работе ставится задача разработки метода выделения из исходной выборки данных кластеров произвольной формы. Для решения поставленной задачи в работе рассматривается нечеткая версия кластеризации для алгоритма k-средних с ограниченной массой рабочей области формирования кластеров. Оценка количества кластеров проводится по гистограмме частот, для определения оптимального количества столбцов гистограммы обосновывается применение формулы Скотта. Алгоритм позволяет формировать кластеры произвольной конфигурации с получением значения меры принадлежности объекта каждому из кластеров. Эффективность алгоритма продемонстрирована на примере кластеризации набора данных «Ирисы Фишера». Проведено сравнительное тестирование: классический алгоритм k-средних, метод Варда и разработанный алгоритм. Полученные результаты позволили отдать предпочтение в задачах анализа кластеров произвольной формы разработанной в данной работе версии нечеткого k-средних с ограниченной массой рабочей области формирования кластеров. Расчет функции принадлежности позволяет получить дополнительную информацию о структуре кластерных образований, а также осуществить поправки результата кластеризации kсредних с ограниченной массой, что особенно важно для алгоритмов, получающих результат кластеризации за один проход. Относительно сравнения качественных результатов разработанного алгоритма и алгоритма Варда следует отметить, что разработанный алгоритм имеет низкую вычислительную стоимость так как не требует дополнительной памяти для хранения матрицы расстояний и времени на ее перерасчет. Кроме того, разработан алгоритм не имеет проблем, связанных с разрезом дендрограммы для получения кластеров. | ru |
dc.description.abstractuk | Завдання визначення функціонального зв'язку між біофізичними показниками є складовою частиною вирішення актуальної проблеми пошуку оптимальних впливів на біологічний об'єкт і не вирішено на даний час в повній мірі. Однією з важливих задач в цій області є розбиття простору ознак на області (кластери), які відносяться до різних функціональних співвідношень, що зв'язують біофізичні показники, шукані кластери при цьому можуть мати довільну форму. Такі кластери назвемо функціональними, в роботі ставиться задача розробки методу виділення з вихідної вибірки даних кластерів довільної форми. Для вирішення поставленої задачі в роботі розглядається нечітка версія кластеризації для алгоритму k-середніх з обмеженою масою робочої області формування кластерів. Оцінка кількості кластерів проводиться за гістограмою частот, для визначення оптимальної кількості стовпців гістограми обґрунтовується застосування формули Скотта. Алгоритм дозволяє формувати кластери довільної конфігурації з отриманням значення міри належності об'єкта до кожного з кластерів. Ефективність алгоритму продемонстрована на прикладі кластеризації набору даних «Іриси Фішера». Проведено порівняльне тестування: класичний алгоритм k-середніх, метод Варда та розроблений алгоритм. Результати, що одержано, дозволили віддати перевагу в задачі аналізу кластерів довільної форми розробленій в даній роботі версії нечіткого k-середніх з обмеженою масою робочої області формування кластерів. Розрахунок функції належності дозволяє отримати додаткову інформацію про структуру кластерних утворень, а також здійснити поправки результату кластеризації k-середніх з обмеженою масою, що особливо важливо для алгоритмів, що отримують результат кластеризації за один прохід. Відносно порівняння якісних результатів розробленого алгоритму та алгоритму Варда слід відмітити, що розроблений алгоритм має нижчу обчислювальну вартість так як не вимагає додаткової пам'яті для зберігання матриці відстаней та часу на її перерахунок. Крім того, розроблений алгоритм не має проблем, пов'язаних з розрізом дендрограми для отримання кластерів. | uk |
dc.format.pagerange | С. 65-70 | uk |
dc.identifier.citation | Настенко, Є. А. Метод нечітких k-середніх з обмеженою масою робочої області формування кластерів довільної форми / Настенко Є. А., Уманець В. С. // Біомедична інженерія і технологія. – 2018. – № 1(1). – С. 65–70. – Бібліогр.: 7 назв. | uk |
dc.identifier.doi | https://doi.org/10.20535/2617-8974.2018.1(1).152464 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/33675 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.source | Біомедична інженерія і технологія, 2018, № 1(1) | uk |
dc.subject | кластеризація | uk |
dc.subject | k-середніх | uk |
dc.subject | міра належности | uk |
dc.subject | оцінка кількості кластерів | uk |
dc.subject | нечітка кластеризація | uk |
dc.subject | clustering | en |
dc.subject | k-means | en |
dc.subject | membership function | en |
dc.subject | estimation of number of clusters | en |
dc.subject | fuzzy clustering | en |
dc.subject | кластеризация | ru |
dc.subject | k-средних | ru |
dc.subject | мера принадлежности | ru |
dc.subject | оценка количества кластеров | ru |
dc.subject | нечеткая кластеризация | ru |
dc.subject.udc | 681.513.8 | uk |
dc.title | Метод нечітких k-середніх з обмеженою масою робочої області формування кластерів довільної форми | uk |
dc.title.alternative | Fuzzy k-means method with a limited mass of the working region for the formation of arbitrary shaped clusters | en |
dc.title.alternative | Метод нечетких k-средних с ограниченной массой рабочей области формирования кластеров произвольной формы | ru |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- BmET-2018-1_p65-70.pdf
- Розмір:
- 376.5 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: