Система інтелектуального аналізу наукових статей на основі мультиагентної архітектури з використанням великих мовних моделей

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. Експоненційне зростання кількості наукових публікацій (понад 3 млн щорічно) створює проблему "інформаційного перевантаження", унеможливлюючи ефективний ручний аналіз літератури. Великі мовні моделі (LLM) демонструють значний потенціал в автоматизації цього процесу, проте їх використання стримується проблемою "галюцинацій" — генерацією правдоподібних, але фактично хибних тверджень. Існуючі методи, такі як RAG (Retrieval-Augmented Generation), фокусуються на зовнішній верифікації фактів, часто ігноруючи внутрішню логічну цілісність документа. Відсутність інструментів для виявлення семантичних суперечностей між розділами наукової статті (наприклад, коли висновки не випливають з результатів) знижує довіру до автоматизованих систем аналізу та може призвести до поширення помилкових наукових знань. Об’єктом дослідження є процес автоматизованого аналізу та верифікації наукових текстів з використанням великих мовних моделей. Предметом дослідження є методи та алгоритми мультиагентної взаємодії для структурно-обізнаного виявлення логічних суперечностей у неструктурованих наукових документах. Мета роботи: Підвищення достовірності автоматизованого аналізу наукових статей шляхом розробки мультиагентної системи для виявлення внутрішніх логічних суперечностей. Наукова новизна полягає в наступному: • Запропоновано метод структурно-обізнаного аналізу, який на відміну від монолітних підходів, використовує композиційну структуру документа як контекстний каркас, що дозволяє виявляти неузгодженості між логічно залежними частинами тексту. • Проведено порівняльний аналіз Single-LLM та мультиагентної взаємодії в задачі структурно-орієнтованої перевірки наукових текстів, що дозволило експериментально показати підвищення стійкості до помилкових узагальнень та зниження кількості пропущених логічних суперечностей. Практична цінність отриманих результатів полягає у розробці прототипу програмної системи, що дозволяє автоматизувати процес первинного аналізу наукових текстів на предмет логічних помилок. Запропоноване рішення може слугувати допоміжним інструментом для дослідників при підготовці публікацій, а також використовуватись як компонент систем підтримки прийняття рішень у процесі академічного рецензування. Апробація роботи. Основні положення і результати представлені та обговорювались на: • XVIII-й науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2025 (Київ, 19-21 листопада 2025 р.). Публікації. За тематикою проведених досліджень опубліковано наукову працю, а саме тези доповідей на конференції. Структура та обсяг роботи. Магістерська робота складається зі вступу, чотирьох розділів та висновків. У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень. У першому розділі розділі проведено огляд сучасних підходів до аналізу наукових текстів та методів забезпечення достовірності LLM У другому розділі описано архітектуру та алгоритми запропонованої мультиагентної системи структурно-обізнаного аналізу. У третьому розділі наведено реалізацію програмного прототипу, приклади коду, деталі агентів та робочих процесів. У червертому розділі представлені результати експериментальних досліджень, порівняння Single-LLM та мультиагентної системи, кількісний та якісний аналіз ефективності підходу. Ключові слова: великі мовні моделі, мультиагентні системи, структурно-обізнаний аналіз, логічна узгодженість, наукові тексти, порівняльний експеримент.

Опис

Ключові слова

великі мовні моделі, мультиагентні системи, структурно-обізнаний аналіз, логічна узгодженість, наукові тексти, порівняльний експеримент., large language models, multi-agent systems, structure-aware analysis, logical coherence, scientific texts, comparative experiment.

Бібліографічний опис

Доліч, А. І. Система для інтелектуального аналізу наукових статей на основі мультиагентної архітектури з використанням великих мовних моделей : магістерська дис. : 123 Комп'ютерна інженерія / Доліч Артем Ігорович. – Київ, 2025. – 105 с.

ORCID

DOI