Інформаційна система добування фактів з україномовних текстів

Турко, Микола Васильович

Інформаційна система добування фактів з україномовних текстів

dc.contributor.advisor	Фіногенов, Олексій Дмитрович
dc.contributor.author	Турко, Микола Васильович
dc.date.accessioned	2022-04-21T11:38:17Z
dc.date.available	2022-04-21T11:38:17Z
dc.date.issued	2021-06
dc.description.abstracten	Explanatory note of the diploma project consists of five sections, contains 27 drawings, 19 tables, 1 addition-paper and 11 sources. The diploma project is devoted to solving the problem of extracting facts from Ukrainian-language texts. The purpose of the system is to automate the process of extracting structured information from unstructured text sources by recognizing named entities. The general provisions section describes the process of extracting facts from the text, including the functional model of the system and its differences from available analogues. This section also describes the purpose of development and tasks that need to be solved. The information providing section gives a description of the input and output data, including a detailed description of the dictionary database for morphological analysis. The section of mathematical software is devoted to the substantiation of the chosen methods of solving the problem and the description of the algorithm that recognizes the named entities. The software section describes the tools for developing a software product and the stages of designing its architecture. Describes the specification of functions and reports generated during protokenTag startup. The technological section defines the purpose of software product testing and describes their results. The results of experimental studies are also presented.	uk
dc.description.abstractuk	Пояснювальна записка дипломного проекту складається з п’яти розділів, містить 23 рисунків, 19 таблиць, 1 додаток та 18 джерел. Дипломний проект присвячений вирішенню задачі добування фактів з україномовних текстів. Метою створення системи є автоматизація процесу добування структурованої інформації з неструктурованих текстових джерел за допомогою розпізнавання іменованих сутностей для української мови. У розділі загальних положень описано процес діяльності добування фактів з тексту, функціональну модель системи та її відмінності від наявних аналогів. Визначено мету розробки та встановлено задачі, які необхідно вирішити. У розділі інформаційного забезпечення надано опис вхідних та вихідних даних, включно з детальним описом базу даних словника для проведення морфологічного аналізу. Розділ математичного забезпечення присвячений обґрунтуванню вибраних методів розв’язання задачі та опису алгоритму, який розпізнає іменовані сутності. Розділ програмного забезпечення описує засоби розробки програмного продукту та етапи проектування його архітектури. Описано специфікацію функцій та звіти, які генеруються в ході запуску програми. У технологічному розділі визначено мету проведення випробувань програмного продукту та описано їх результати. Також наведені результати експериментальних досліджень.	uk
dc.format.page	107 с.	uk
dc.identifier.citation	Турко, М. В. Інформаційна система добування фактів з україномовних текстів : дипломний проєкт ... бакалавра : 126 Інформаційні системи та технології / Турко Микола Васильович. – Київ, 2021. – 107 с.	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/46954
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.subject	обробка природної мови	uk
dc.subject	обробка тексту	uk
dc.subject	розпізнавання іменованих сутностей	uk
dc.title	Інформаційна система добування фактів з україномовних текстів	uk
dc.type	Bachelor Thesis	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Turko_bakalavr.pdf
Розмір:: 6.5 MB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.1 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (АСОІУ)
Бакалаврські роботи