Дисертації (ОТ)
Постійне посилання зібрання
У зібранні розміщено дисертації, які захищені працівниками кафедри.
Переглянути
Перегляд Дисертації (ОТ) за Ключові слова "audio analysis"
Зараз показуємо 1 - 1 з 1
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Метод підвищення ефективності діагностичних систем в аналізі звуку на основі нейронних мереж(КПІ ім. Ігоря Сікорського, 2025) Панаскін, Денис Валентинович; Стіренко, Сергій ГригоровичПанаскін Д.В. Метод підвищення ефективності діагностичних систем в аналізі звуку на основі нейронних мереж. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення та 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2025. Метою дослідження було оцінити потенціал глибинного навчання для виявлення респіраторних захворювань у записах легеневих звуків (аускультація), а також вивчити можливість збільшення обсягу тренувальних даних шляхом генерації синтетичних спектральних репрезентацій. У роботі запропоновано NASCA-метод (Neural-Augmented Sound Classification for Auscultation), що поєднує обробку аудіозаписів, згорткові варіаційні автокодувальники (CVAE) для аугментації та класичну CNN-модель. Дослідження було проведено на основі набору даних ICBHI (Міжнародна конференція з біомедичної та медичної інформатики), який складався з 126 суб'єктів і загалом 920 звуків аускультації легень, серед яких 810 із хронічними захворюваннями, 75 з не хронічними захворюваннями та 35 без будь-яких патологій. На етапі попередньої обробки частота була знижена до 4 кГц і було відфільтровано неінформативні частотні діапазони. Кожен зразок був перетворений у частотний спектр, і були згенеровані мел-спектрограми. Для вирішення проблеми дисбалансу класів було згенеровано синтетичні спектрограми з використанням згорткових варіаційних автокудувальників. Для побудови моделі була використана класична згорткова нейронна мережа. Ефективність алгоритму оцінювали за допомогою перехресної валідації з 10-кратним поділом, а також через експерименти з розділенням аудіозаписів на навчальні та тестові набори на основі групування пацієнтів. Результати були оцінені за такими метриками, як чутливість, специфічність, F1-міра та коефіцієнт Каппа Коена, і досягли F1-міри в 98,45% для задачі класифікації на 5 класів. Дослідження підкреслює потенціал запропонованого методу для синтезу та збільшення чутливих медичних даних і визначає області для подальших досліджень у виявленні клінічних респіраторних захворювань. Запропонований підхід до синтезу даних має особливе значення в медичних дослідженнях, де часто бракує якісних і збалансованих записів. Застосування згорткових варіаційних автокодувальників для генерування синтетичних зразків істотно покращує якість навчання моделей, що, своєю чергою, позитивно впливає на точність класифікації та ранню діагностику респіраторних захворювань. Використання глибоких нейронних мереж для аналізу медичних аудіоданих відкриває нові перспективи автоматизації діагностичних процесів. Такий підхід може істотно скоротити час для первинної оцінки стану пацієнта, полегшити навантаження на медичних фахівців і підвищити ефективність лікування, даючи змогу зосередитися на критичних випадках. Подальші дослідження варто зосередити на кількох взаємопов’язаних напрямах. Насамперед, планується розширити NASCA-метод шляхом інтеграції ембеддингів легеневих звуків із великими мовними моделями (LLM) для мультимодального аналізу (текст + аудіо) з використанням GPT, BERT тощо. Актуальним є також включення до аналізу інших біомедичних сигналів, наприклад фонокардіограм, і їх комбіноване використання з легеневими шумами задля підвищення діагностичної специфічності. Крім того, суттєві перспективи відкриває розробка та валідація федеративного навчання (FL) для обробки розподілених клінічних баз з урахуванням вимог конфіденційності та захисту персональних даних. Поряд із цим, оптимізація архітектур глибинних мереж і вдосконалення методів генерації синтетичних даних залишаються важливими завданнями для ефективного подолання дисбалансу класів і забезпечення високої точності діагностики.