Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту

Молчанов, Олексій АндрійовичСоболєв, Тимур Юрійович2025-07-012025-07-012025Соболєв, Т. Ю. Вебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелекту : дипломний проєкт ... бакалавра : 123 Комп'ютерна інженерія / Соболєв Тимур Юрійович. - Київ, 2025. - 103 с.https://ela.kpi.ua/handle/123456789/74560Кваліфікаційна робота містить пояснювальну записку (58 с., 18 рис., 4 табл., 7 додатків). Метою розробки є створення вебзастосунку, який дає змогу здійснювати структурований аналіз вмісту PDF-документів та видобувати релевантну інформацію відповідно до заданого предметного середовища із використанням засобів штучного інтелекту. У контексті фармацевтичної галузі реалізовано можливість автоматичного визначення загальних атрибутів документа (автори, дата публікації, дата створення) та спеціалізованих відомостей — таких як описи побічних реакцій, клінічний перебіг випадків та результат лікування. У ході розробки: • проведено аналіз існуючих рішень для обробки PDF-документів, зокрема ChatPDF та інших сервісів із використанням LLM; • здійснено порівняння мовних моделей великого масштабу та обґрунтовано вибір моделі GPT-4o; • розроблено інтерфейс користувача для завантаження документів та перегляду результатів обробки; • реалізовано формат представлення результатів у структурованому вигляді (XML) для подальшого перетворення у таблиці; • впроваджено логіку витягу специфічних фармацевтичних сутностей. Система впроваджується в ТОВ “Інститут розробки інформаційних систем” (додаток Д) з метою подальшого практичного використання в діяльності підприємств фармацевтичного сектора.103 с.ukвебзастосуноквитяг інформаціїштучний інтелектPDFфармацевтикаGPTXMLструктуровані даніweb applicationinformation extractionartificial intelligencepharmaceuticalsstructured dataВебзастосунок автоматизованого видобутку інформації з файлів із використанням засобів штучного інтелектуBachelor Thesis