Інформаційна система для реферування наукових текстів

dc.contributor.advisorГавриленко, Олена Валеріївна
dc.contributor.authorТолкунов, Іван Сергійович
dc.date.accessioned2025-03-12T09:03:31Z
dc.date.available2025-03-12T09:03:31Z
dc.date.issued2024
dc.description.abstractНовизна, полягає в адаптації існуючих алгоритмів реферування для роботи з україномовними науковими текстами. Актуальність теми. Автоматизація реферування україномовних наукових текстів є актуальною задачею для сучасного наукового середовища України через зростання обсягів інформації та необхідність швидкого доступу до неї. Мета дослідження. Створення інформаційної системи для автоматичного реферування текстів із високим рівнем точності та адаптивності до мовних і контекстуальних особливостей української мови. Об’єкт дослідження. Україномовні наукові тексти. Предмет дослідження. Інформаційна система реферування наукових україномовних текстів. Завдання. Аналіз існуючих рішень та виявлення переваг та недоліків; додавання можливості перекладу реферату іноземними мовами; модифікація алгоритму реферування з використанням ланцюгів Маркова та асоціативних правил; інтеграція та вдосколення моделей BERT і алгоритму TextRank для аналізу контексту та ключових фраз; тестування та аналіз ефективності алгоритмів.
dc.description.abstractotherThe explanatory note of the diploma project consists of five sections, contains 29 tables, 9 applications and 26 sources - a total of 123 pages. The object of study: ukrainian- language scientific texts. The aim of the diploma project: Development of an information system for automatic summarization of texts with a high level of accuracy and adaptability to the linguistic and contextual features of the Ukrainian language. In the first chapter, the subject area is described, including a classification of existing methods for automatic summarization of scientific texts. An analysis of current solutions, their advantages and disadvantages, and a comparative assessment of the existing systems were conducted. The second chapter provides a review of existing text summarization algorithms, including algorithms based on lexical and statistical analysis, machine learning, and natural language processing (NLP) methods. The third chapter describes the mathematical framework. Key approaches such as the modification of the TextRank algorithm for Ukrainian texts, the use of the BERT language model, and the integration of associative rules with Markov chains are discussed. Additionally, methods for evaluating the effectiveness of summaries are described. In the fourth chapter, the selection of tools and technologies for implementing the system is justified. The database structure, client-side and server-side components, as well as the features of creating a user interface, are detailed. The fifth chapter elaborates on the concept of market implementation of the startup. A competitor analysis was performed, strategic advantages of the development were identified, and the prospects for commercializing the developed system were evaluated.
dc.format.extent114 с.
dc.identifier.citationТолкунов, І. С. Інформаційна система для реферування наукових текстів : магістерська дис. : 126 Інформаційні системи та технології / Толкунов Іван Сергійович – Київ, 2024. – 114 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/72864
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectУкраїномовна система
dc.subjectTextRank
dc.subjectланцюги Маркова
dc.subjectасоціативні правла
dc.subjectBERT
dc.subjectнауковий текст
dc.subjectреферування
dc.subject.udc004.9
dc.titleІнформаційна система для реферування наукових текстів
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Tolkunov_magistr.pdf
Розмір:
2.87 MB
Формат:
Adobe Portable Document Format