Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Кваліфікаційна робота містить пояснювальну записку (58 с., 18 рис., 4 табл., 7 додатків). Метою розробки є створення вебзастосунку, який дає змогу здійснювати структурований аналіз вмісту PDF-документів та видобувати релевантну інформацію відповідно до заданого предметного середовища із використанням засобів штучного інтелекту. У контексті фармацевтичної галузі реалізовано можливість автоматичного визначення загальних атрибутів документа (автори, дата публікації, дата створення) та спеціалізованих відомостей — таких як описи побічних реакцій, клінічний перебіг випадків та результат лікування. У ході розробки: • проведено аналіз існуючих рішень для обробки PDF-документів, зокрема ChatPDF та інших сервісів із використанням LLM; • здійснено порівняння мовних моделей великого масштабу та обґрунтовано вибір моделі GPT-4o; • розроблено інтерфейс користувача для завантаження документів та перегляду результатів обробки; • реалізовано формат представлення результатів у структурованому вигляді (XML) для подальшого перетворення у таблиці; • впроваджено логіку витягу специфічних фармацевтичних сутностей. Система впроваджується в ТОВ “Інститут розробки інформаційних систем” (додаток Д) з метою подальшого практичного використання в діяльності підприємств фармацевтичного сектора.

Опис

Ключові слова

вебзастосунок, витяг інформації, штучний інтелект, PDF, фармацевтика, GPT, XML, структуровані дані, web application, information extraction, artificial intelligence, pharmaceuticals, structured data

Бібліографічний опис

Соболєв, Т. Ю. Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту : дипломний проєкт ... бакалавра : 123 Комп'ютерна інженерія / Соболєв Тимур Юрійович. - Київ, 2025. - 103 с.

ORCID

DOI