Інформаційна система добування фактів з україномовних текстів

dc.contributor.advisorФіногенов, Олексій Дмитрович
dc.contributor.authorТурко, Микола Васильович
dc.date.accessioned2022-04-21T11:38:17Z
dc.date.available2022-04-21T11:38:17Z
dc.date.issued2021-06
dc.description.abstractenExplanatory note of the diploma project consists of five sections, contains 27 drawings, 19 tables, 1 addition-paper and 11 sources. The diploma project is devoted to solving the problem of extracting facts from Ukrainian-language texts. The purpose of the system is to automate the process of extracting structured information from unstructured text sources by recognizing named entities. The general provisions section describes the process of extracting facts from the text, including the functional model of the system and its differences from available analogues. This section also describes the purpose of development and tasks that need to be solved. The information providing section gives a description of the input and output data, including a detailed description of the dictionary database for morphological analysis. The section of mathematical software is devoted to the substantiation of the chosen methods of solving the problem and the description of the algorithm that recognizes the named entities. The software section describes the tools for developing a software product and the stages of designing its architecture. Describes the specification of functions and reports generated during protokenTag startup. The technological section defines the purpose of software product testing and describes their results. The results of experimental studies are also presented.uk
dc.description.abstractukПояснювальна записка дипломного проекту складається з п’яти розділів, містить 23 рисунків, 19 таблиць, 1 додаток та 18 джерел. Дипломний проект присвячений вирішенню задачі добування фактів з україномовних текстів. Метою створення системи є автоматизація процесу добування структурованої інформації з неструктурованих текстових джерел за допомогою розпізнавання іменованих сутностей для української мови. У розділі загальних положень описано процес діяльності добування фактів з тексту, функціональну модель системи та її відмінності від наявних аналогів. Визначено мету розробки та встановлено задачі, які необхідно вирішити. У розділі інформаційного забезпечення надано опис вхідних та вихідних даних, включно з детальним описом базу даних словника для проведення морфологічного аналізу. Розділ математичного забезпечення присвячений обґрунтуванню вибраних методів розв’язання задачі та опису алгоритму, який розпізнає іменовані сутності. Розділ програмного забезпечення описує засоби розробки програмного продукту та етапи проектування його архітектури. Описано специфікацію функцій та звіти, які генеруються в ході запуску програми. У технологічному розділі визначено мету проведення випробувань програмного продукту та описано їх результати. Також наведені результати експериментальних досліджень.uk
dc.format.page107 с.uk
dc.identifier.citationТурко, М. В. Інформаційна система добування фактів з україномовних текстів : дипломний проєкт ... бакалавра : 126 Інформаційні системи та технології / Турко Микола Васильович. – Київ, 2021. – 107 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/46954
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectобробка природної мовиuk
dc.subjectобробка текстуuk
dc.subjectрозпізнавання іменованих сутностейuk
dc.titleІнформаційна система добування фактів з україномовних текстівuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Turko_bakalavr.pdf
Розмір:
6.5 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: