Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту

Соболєв, Тимур Юрійович

Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту

Файли

Sobolev_bakalavr.pdf (1.95 MB)

Дата

2025

Автори

Соболєв, Тимур Юрійович

Науковий керівник

Молчанов, Олексій Андрійович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Кваліфікаційна робота містить пояснювальну записку (58 с., 18 рис., 4 табл., 7 додатків). Метою розробки є створення вебзастосунку, який дає змогу здійснювати структурований аналіз вмісту PDF-документів та видобувати релевантну інформацію відповідно до заданого предметного середовища із використанням засобів штучного інтелекту. У контексті фармацевтичної галузі реалізовано можливість автоматичного визначення загальних атрибутів документа (автори, дата публікації, дата створення) та спеціалізованих відомостей — таких як описи побічних реакцій, клінічний перебіг випадків та результат лікування. У ході розробки: • проведено аналіз існуючих рішень для обробки PDF-документів, зокрема ChatPDF та інших сервісів із використанням LLM; • здійснено порівняння мовних моделей великого масштабу та обґрунтовано вибір моделі GPT-4o; • розроблено інтерфейс користувача для завантаження документів та перегляду результатів обробки; • реалізовано формат представлення результатів у структурованому вигляді (XML) для подальшого перетворення у таблиці; • впроваджено логіку витягу специфічних фармацевтичних сутностей. Система впроваджується в ТОВ “Інститут розробки інформаційних систем” (додаток Д) з метою подальшого практичного використання в діяльності підприємств фармацевтичного сектора.

Ключові слова

вебзастосунок, витяг інформації, штучний інтелект, PDF, фармацевтика, GPT, XML, структуровані дані, web application, information extraction, artificial intelligence, pharmaceuticals, structured data

Бібліографічний опис

Соболєв, Т. Ю. Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту : дипломний проєкт ... бакалавра : 123 Комп'ютерна інженерія / Соболєв Тимур Юрійович. - Київ, 2025. - 103 с.

URI

https://ela.kpi.ua/handle/123456789/74560

Зібрання

Бакалаврські роботи (СПСКС)
Бакалаврські роботи

Повна інформація про документ

Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання