Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні

dc.contributor.authorОхріменко, Антон Олександрович
dc.contributor.authorКуссуль, Наталія Миколаївна
dc.date.accessioned2023-11-07T14:39:35Z
dc.date.available2023-11-07T14:39:35Z
dc.date.issued2023
dc.description.abstractРозглядається проблема неоднозначності в задачах класифікації в області ма-шинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різнимклас ам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складнаабо навіть неможлива, незалежно від складності моделі машинного навчання.Запропоно-вано метод та алгоритм виявлення таких неоднозначних екземплярів даних, щобазу ються на використанні методу найближчого сусіда та аналізу класів екзе-мплярів даних, розташованих поряд у просторі ознак, та дозволяютьвиділити підмножину неоднозначних екземплярів даних, що можуть негативно впливатина процес навчання моделі класифікації.З метою демонстрації практичного за-стосування алгоритму проведено експеримент на чотириканальному супутни-ковому композиті, що використовується для попіксельної класифікації сільсь-когосподарських культур. Визначено відсоток ненадійних даних загалом та окремо для кожної культури. Одним з основних результатів дослідження є мо-жливість використання запропонованого алгоритму під час конструювання да-тасету(набору даних, dataset) для навчання моделі класифікації.Віндопомагає виявити потенційно проблемні екземпляри даних та забезпечити якість вхідно-го набору даних. Крім того, розглянуто можливості застосування алгоритму після процесу навчання моделі привикористаннів операційному режимі. Ви-явлення неоднозначних екземплярів може допомогти знайти потенційні поми-лки класифікації та покращити результати роботи моделі.Представлений ал-горитм може стати важливим інструментом для дослідника впродовж повного циклу розробки моделі машинного навчання, починаючи від підготовки даних для навчання і закінчуючи її практичним впровадженням. Його застосування скороч уватиме часна отримання якісних навчальних даних, покращуватимеметрикикласифікації та забезпечуватимебільш надійнірезультатиу задачах машинного навчання.uk
dc.format.pagerangeС. 84-95uk
dc.identifier.citationОхріменко, А. О. Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / Охріменко А. О., Куссуль Н. М. // Міжнародний науково-технічний журнал "Проблеми керування та інформатики". - 2023. - № 4 . - С. 84-95.uk
dc.identifier.doihttps://doi.org/10.34229/1028-0979-2023-4-7
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/62053
dc.language.isoukuk
dc.publisherІнститут кібернетики ім. В.М. Глушкова НАН Україниuk
dc.publisher.placeКиївuk
dc.relation.ispartofМіжнародний науково-технічний журнал "Проблеми керування та інформатики", 2023, № 4uk
dc.subjectmachine learninguk
dc.subjectclassifieruk
dc.subjectthe nearest neighbor methoduk
dc.subjectdataset quality assessmentuk
dc.subjectimbalanced datasetsuk
dc.subjecthard casesuk
dc.subject.udc004.8, 004.93uk
dc.titleМетод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанніuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Metod_vyiavlennia_skladnykh_dlia_rozpiznavannia_zrazkiv.pdf
Розмір:
548.14 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис:

Зібрання