Метод мультимодального глибокого навчання з механізмами уваги для прогнозування чутливості пухлин до протипухлинних препаратів
Вантажиться...
Дата
2026
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація за темою «Метод мультимодального глибокого навчання з механізмами уваги для прогнозування чутливості пухлин до протипухлинних препаратів» виконана студентом кафедри біомедичної кібернетики ФСП Порхало Денисом Федоровичем зі спеціальності 122 «Комп’ютерні науки» за освітньо-науковою програмою «Комп’ютерні науки» та складається зі: вступу; 4 розділи (Аналітичний огляд сучасного стану проблеми прогнозування чутливості пухлинних клітин до протипухлинних препаратів, Архітектура та методи навчання мультимодальної моделі BCNexus з механізмами уваги, Обґрунтування вибору програмного середовища для мультимодального глибокого навчання на основі натренованих молекулярно-мовних моделях для вирішення задач обчислювальної фармакогеноміки, Інформаційне забезпечення. Програмна реалізація та методика роботи програмної системи OncoPredict AI на основі гібридної архітектури BCNexus). Інформаційне забезпечення. Програмна реалізація та методика роботи програмної системи OncoPredict AI на основі гібридної архітектури BCNexus), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 65 джерел. Загальний обсяг роботи 124 сторінки.
Актуальність теми. Прогнозування чутливості пухлинних клітинних ліній до протипухлинних препаратів — одна з основних задач персоналізованої онкології. За строгого протоколу Drug Split, який відтворює клінічно релевантний сценарій передбачення відповіді на структурно нові сполуки, точність сучасних моделей не перевищує діапазону Pearson r = 0,45–0,60. Це робить актуальним пошук нових архітектурних рішень. У роботі застосовано архітектуру «трансформер», графові нейронні мережі GATv2, багатоголову крос-увагу, трансферне навчання з ChemBERTa, імовірнісне моделювання з функцією втрат Gaussian NLL, парний t-критерій Стьюдента, критерій знакових рангів Вілкоксона, аналіз калібрування за критерієм Expected Calibration Error та інтерпретаційний аналіз вагових коефіцієнтів уваги. Уперше запропоновано та експериментально досліджено архітектуру BCNexus, яка об'єднує: гібридний кодувальник препарату на основі ChemBERTa та GATv2 з ген-обумовленим біо-гейтингом; модульний транскриптомний кодувальник; модуль багатоголової крос-уваги між геномним запитом та токенами SMILES; імовірнісний вихід з оцінюванням невизначеності. Емпірично встановлено емерджентне фокусування ваг кросуваги на токенах-гетероатомах (N, O, S), що відповідають фармакофорним підструктурам, без апріорної біологічної підказки у навчальному процесі. Кількісно охарактеризовано підпростори хімічного простору, у яких прогноз є достатньо надійним. Модель BCNexus застосовна як інструмент попереднього обчислювального скринінгу нових протипухлинних сполук та як компонент систем підтримки клінічних рішень у персоналізованій онкології. На кросдатасет валідації GDSC2 → GDSC1 без донавчання BCNexus перевершила DeepCDR за обома ключовими метриками (Pearson r = 0,4730 проти 0,4647; RMSE = 2,5289 проти 2,5981); відносне падіння якості при переході між наборами для BCNexus удвічі менше (9,6 % проти 18,2 %). Мета і задачі дослідження. Метою дисертаційної роботи є визначення ефективності мультимодального методу глибинного навчання з механізмами крос-уваги та трансферним навчанням із молекулярно мовних моделей для прогнозування чутливості пухлинних клітинних ліній до протипухлинних препаратів за умов узагальнення на структурно нові хімічні сполуки. Сформульовано наступні задачі: 1) Провести аналіз сучасного стану проблеми прогнозування чутливості до протипухлинних препаратів 2) Оглянути існуючі підходи (класичні методи машинного навчання, графові нейронні мережі, мультимодальні архітектури) та виявлення їх обмежень у контексті генералізації на нові хімічні сполуки. 3) Дослідити можливості трансферного навчання з попередньо натренованих молекулярних мовних моделей у задачах обчислювальної фармакогеноміки. 4) Розробити архітектуру мультимодальної нейронної мережі, що об’єднує гібридний кодувальник препарату на основі ChemBERTa та GATv2 з ген-обумовленим гейтингом, модульний транскриптомний кодувальник, модуль багатоголової крос-уваги між геномним запитом і токенами SMILES, а також імовірнісний вихід із функцією втрат типу Gaussian Negative Log-Likelihood. 5) Дослідити ефективність запропонованої моделі за протоколом Drug Split на наборах даних GDSC2 та GDSC1 у порівнянні з трьома базовими архітектурами (DeepCDR, GraphDRP, MLP на відбитках Моргана) із застосуванням критеріїв Пірсона, Спірмена, RMSE та тестів статистичної значущості (парний t-критерій Стьюдента, критерій знакових рангів Вілкоксона). 6) Провести абляційне дослідження для кількісного оцінювання внеску кожного архітектурного компонента (графовий кодувальник GATv2, модульний геномний кодувальник, модуль крос-уваги) у точність прогнозу. 7) Проаналізувати якість калібрування імовірнісного виходу моделі за критерієм Expected Calibration Error (ECE) та дослідження біологічної когерентності ваг крос-уваги на рівні токенів SMILES. 8) Проаналізувати залежність абсолютної похибки прогнозу від молекулярних дескрипторів хімічних сполук із метою характеризації підпросторів хімічного простору, у яких прогноз є достатньо надійним. Об’єкт дослідження. Процес прогнозування чутливості пухлинних клітинних ліній до протипухлинних препаратів на основі геномних та молекулярно-хімічних даних. Предмет дослідження. Методи та моделі мультимодального глибинного навчання з механізмами уваги та трансферним навчанням для прогнозування логарифма напівмаксимальної інгібіторної концентрації (LN_IC50) пар «препарат – клітинна лінія». Методи дослідження. Для розв’язання поставлених завдань використано методи глибинного навчання (архітектури типу «трансформер», графові нейронні мережі з механізмом уваги GATv2, модулі багатоголової крос-уваги, методи регуляризації dropout та шарової нормалізації), методи трансферного навчання з двофазним режимом донавчання та диференціальними швидкостями навчання, методи оптимізації (AdamW, ReduceLROnPlateau, обмеження норми градієнта), методи математичної статистики (парний t-критерій Стьюдента, критерій знакових рангів Вілкоксона, міра ефекту Коена), а також методи кількісного оцінювання калібрування імовірнісних прогнозів (Expected Calibration Error, діаграми надійності). Практичне значення одержаних результатів. Розроблена модель BCNexus може використовуватися як інструмент попереднього обчислювального скринінгу нових протипухлинних сполук, як компонент систем підтримки клінічних рішень у персоналізованій онкології, а також як базовий метод для подальшого донавчання на клінічних наборах даних (зокрема, на даних пацієнт-похідних ксенотрансплантатів та клінічних когорт). Наявність імовірнісного виходу та інтерпретованих ваг крос-уваги дає змогу оцінювати надійність прогнозів індивідуально для кожного передбачення і формулювати біологічно обґрунтовані гіпотези щодо фармакофорних фрагментів молекул, релевантних у контексті конкретного транскриптомного профілю.
Опис
Ключові слова
глибинне навчання, механізм крос-уваги, ChemBERTa, GDSC, персоналізована онкологія, фармакогеноміка, deep learning, cross-attention mechanism, personalized oncology, pharmacogenomics
Бібліографічний опис
Порхало, Д. Ф. Метод мультимодального глибинного навчання з механізмами уваги для прогнозування чутливості пухлин до протипухлинних препаратів : магістерська дис. : 122 Комп'ютерні науки / Порхало Денис Федорович. – Київ, 2026. – 155 с.