Спосіб розпізнавання зображень за допомогою оптимізованого алгоритму вибору M-кратних векторів

Вантажиться...
Ескіз

Дата

2026

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. Сучасний розвиток інформаційних технологій супроводжується невпинним зростанням обсягів візуальних даних і ускладненням задач, що ставляться перед системами автоматичного аналізу зображень. Ефективність роботи таких систем визначається не лише архітектурою застосовуваних моделей машинного навчання, але й способом подання та відбору вхідних ознак. Цифрові зображення характеризуються високою розмірністю простору ознак та значною кореляцією між сусідніми пікселями, що породжує проблему інформаційної надлишковості. У цих умовах якість процесу формування підмножин ознак безпосередньо впливає на стабільність навчання, відтворюваність експериментів та узагальнювальну здатність побудованих моделей. Поширені стохастичні методи вибору ознак, до яких належать механізм випадкового вимикання ознак та метод випадкових підпросторів, не забезпечують контрольованого та безповторного покриття простору ознак, що ускладнює аналіз поведінки моделей. Це створює передумови для пошуку детермінованих способів формування підмножин ознак фіксованої потужності, які дозволяють поєднати переваги підпросторових підходів із можливістю чіткого контролю над процесом вибору. Мета роботи. Підвищення стабільності та відтворюваності процесу навчання моделей розпізнавання зображень шляхом розроблення способу детермінованого формування M-кратних векторів ознак на основі оптимізованого алгоритму комбінаторного індексування. Об’єкт дослідження. Процес розпізнавання зображень у системах машинного навчання. Предмет дослідження. Алгоритмічні способи детермінованого формування підмножин ознак фіксованої потужності для моделей класифікації зображень. Методи дослідження. У роботі застосовано методи комбінаторного аналізу для формалізації задачі та обґрунтування детермінованого індексування підмножин ознак, методи теорії множин та лінійної алгебри для опису простору M-кратних векторів, методи машинного навчання для побудови моделей класифікації, а також методи експериментального моделювання для порівняльного аналізу запропонованого та існуючих підходів. Програмна реалізація виконана мовою Python із використанням бібліотек PyTorch, torchvision, NumPy та scikit-learn. Аналіз результатів проведено за допомогою методів описової статистики й оцінки стабільності навчання за множиною незалежних запусків. Наукова новизна одержаних результатів. У результаті виконання роботи отримано такі наукові результати. Удосконалено спосіб формування підмножин ознак для моделей класифікації зображень. На відміну від поширених стохастичних підходів, запропонований спосіб ґрунтується на детермінованому комбінаторному індексуванні M-кратних векторів, що забезпечує однозначну відповідність між номером комбінації та підмножиною активних ознак, унеможливлює повторний вибір однакових комбінацій у межах заданого простору індексів і сприяє більш рівномірному охопленню простору вхідних даних. Дістав подальшого розвитку підхід до інтеграції структурованих методів вибору ознак у механізми регуляризації нейронних мереж та ансамблеві схеми класифікації, що, на відміну від існуючих рішень, дозволяє замінити стохастичну складову детермінованим компонентом без істотної зміни архітектури моделей. Практичне значення одержаних результатів. Розроблений спосіб детермінованого формування M-кратних векторів та реалізована на його основі програмна система можуть бути використані для проведення експериментальних досліджень у задачах машинного навчання, де важливими є відтворюваність результатів та контрольоване формування підпросторів ознак. Результати роботи мають перспективу застосування у системах розпізнавання рукописних символів, попередньої обробки медичних зображень, аналізу документів і у дослідницьких засобах для оцінювання впливу структури вибору ознак на якість класифікації. Програмна система побудована за модульним принципом і допускає інтеграцію розробленого алгоритму у наявні навчальні процедури без істотної зміни архітектури застосовуваних моделей. Особистий внесок магістранта. Усі основні наукові та практичні результати дисертації отримано автором особисто. У спільних публікаціях здобувачем виконано аналіз сучасного стану методів вибору ознак у задачах розпізнавання зображень, узагальнено обмеження поширених стохастичних підходів і сформульовано концепцію детермінованого комбінаторного формування підмножин ознак. У межах магістерської дисертації автором самостійно розроблено формалізоване описання простору M-кратних векторів та оптимізований алгоритм їх формування на основі комбінаторного індексування. Крім того, автором спроєктовано та реалізовано програмну архітектуру системи експериментального дослідження запропонованого підходу й підготовлено методику порівняльного аналізу. Науковий керівник здійснював постановку задачі, загальне керівництво дослідженням і консультативну допомогу. Апробація результатів дисертації. Основні положення та результати роботи були представлені й обговорювались на XVIII науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг – ПМК’2025» (м. Київ, 19–21 листопада 2025 р.). Публікації. За результатами проведених досліджень та суміжних робіт автора опубліковано три наукові праці: тези доповіді на Вісімнадцятій міжнародній науково-практичній конференції «Інтегровані інтелектуальні робототехнічні комплекси – ІІРТК-2025» (м. Київ, 20–21 травня 2025 р.); тези доповіді на Вісімнадцятій науковій конференції магістрантів та аспірантів «Прикладна математика та комп'ютинг – ПМК'2025» (м. Київ, 19–21 листопада 2025 р.), у яких безпосередньо викладено основні положення цієї магістерської дисертації; а також статтю у фаховому науковому виданні «Information, Computing and Intelligent Systems». Структура та обсяг роботи. Магістерська дисертація складається зі вступу, чотирьох розділів, висновків до кожного розділу та загальних висновків по роботі, списку використаних джерел і додатків. У вступі подано загальну характеристику роботи, обґрунтовано актуальність обраного напряму досліджень, сформульовано мету і задачі, визначено об’єкт і предмет дослідження, відображено наукову новизну та практичне значення отриманих результатів. У першому розділі проведено аналіз сучасних підходів до розпізнавання зображень і вибору ознак, розглянуто проблему надлишковості та кореляції ознак у зображеннях, проаналізовано існуючі методи зменшення розмірності та формування підпросторів ознак, виявлено обмеження стохастичних підходів та обґрунтовано доцільність розроблення детермінованих способів вибору ознак. У другому розділі формалізовано задачу вибору M-кратних векторів ознак, розглянуто математичні основи комбінаторного індексування підмножин, досліджено лексикографічний і колексикографічний порядок комбінацій, описано запропонований оптимізований алгоритм формування M-кратних векторів та проаналізовано його властивості. У третьому розділі описано програмну реалізацію системи експериментального дослідження запропонованого алгоритму, обґрунтовано вибір засобів реалізації та архітектуру програмного забезпечення, наведено опис основних модулів системи. У четвертому розділі викладено методику експериментального дослідження, наведено результати порівняльного аналізу запропонованого підходу з базовими та випадковими методами вибору ознак, виконано оцінку точності та стабільності навчання моделей. У висновках підсумовано результати проведеної роботи. Робота викладена на 99 сторінках, містить 10 рисунків, 11 таблиць, посилання на список використаних джерел із 14 найменувань. Ключові слова: розпізнавання зображень, вибір ознак, M-кратні вектори, комбінаторне індексування, Combinadics, Feature Dropout, Feature-Subspace Ensemble, MNIST, машинне навчання, нейронні мережі.

Опис

Ключові слова

розпізнавання зображень, вибір ознак, M-кратні вектори, комбінаторне індексування, Combinadics, Feature Dropout, Feature-Subspace Ensemble, MNIST, машинне навчання, нейронні мережі., image recognition, feature selection, M-fold vectors, combinatorial indexing, machine learning, neural networks

Бібліографічний опис

Черненький, А. О. Спосіб розпізнавання зображень за допомогою оптимізованого алгоритму вибору M-кратних векторів : магістерська дис. : 123 Комп'ютерна інженерія / Черненький Артем Олександрович. – Київ, 2026. – 99 с.

ORCID

DOI