Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
dc.contributor.author | Охріменко, Антон Олександрович | |
dc.contributor.author | Куссуль, Наталія Миколаївна | |
dc.date.accessioned | 2023-11-07T14:39:35Z | |
dc.date.available | 2023-11-07T14:39:35Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Розглядається проблема неоднозначності в задачах класифікації в області ма-шинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різнимклас ам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складнаабо навіть неможлива, незалежно від складності моделі машинного навчання.Запропоно-вано метод та алгоритм виявлення таких неоднозначних екземплярів даних, щобазу ються на використанні методу найближчого сусіда та аналізу класів екзе-мплярів даних, розташованих поряд у просторі ознак, та дозволяютьвиділити підмножину неоднозначних екземплярів даних, що можуть негативно впливатина процес навчання моделі класифікації.З метою демонстрації практичного за-стосування алгоритму проведено експеримент на чотириканальному супутни-ковому композиті, що використовується для попіксельної класифікації сільсь-когосподарських культур. Визначено відсоток ненадійних даних загалом та окремо для кожної культури. Одним з основних результатів дослідження є мо-жливість використання запропонованого алгоритму під час конструювання да-тасету(набору даних, dataset) для навчання моделі класифікації.Віндопомагає виявити потенційно проблемні екземпляри даних та забезпечити якість вхідно-го набору даних. Крім того, розглянуто можливості застосування алгоритму після процесу навчання моделі привикористаннів операційному режимі. Ви-явлення неоднозначних екземплярів може допомогти знайти потенційні поми-лки класифікації та покращити результати роботи моделі.Представлений ал-горитм може стати важливим інструментом для дослідника впродовж повного циклу розробки моделі машинного навчання, починаючи від підготовки даних для навчання і закінчуючи її практичним впровадженням. Його застосування скороч уватиме часна отримання якісних навчальних даних, покращуватимеметрикикласифікації та забезпечуватимебільш надійнірезультатиу задачах машинного навчання. | uk |
dc.format.pagerange | С. 84-95 | uk |
dc.identifier.citation | Охріменко, А. О. Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / Охріменко А. О., Куссуль Н. М. // Міжнародний науково-технічний журнал "Проблеми керування та інформатики". - 2023. - № 4 . - С. 84-95. | uk |
dc.identifier.doi | https://doi.org/10.34229/1028-0979-2023-4-7 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/62053 | |
dc.language.iso | uk | uk |
dc.publisher | Інститут кібернетики ім. В.М. Глушкова НАН України | uk |
dc.publisher.place | Київ | uk |
dc.relation.ispartof | Міжнародний науково-технічний журнал "Проблеми керування та інформатики", 2023, № 4 | uk |
dc.subject | machine learning | uk |
dc.subject | classifier | uk |
dc.subject | the nearest neighbor method | uk |
dc.subject | dataset quality assessment | uk |
dc.subject | imbalanced datasets | uk |
dc.subject | hard cases | uk |
dc.subject.udc | 004.8, 004.93 | uk |
dc.title | Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні | uk |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Metod_vyiavlennia_skladnykh_dlia_rozpiznavannia_zrazkiv.pdf
- Розмір:
- 548.14 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: