Інформаційна система добування фактів з україномовних текстів
dc.contributor.advisor | Фіногенов, Олексій Дмитрович | |
dc.contributor.author | Турко, Микола Васильович | |
dc.date.accessioned | 2022-04-21T11:38:17Z | |
dc.date.available | 2022-04-21T11:38:17Z | |
dc.date.issued | 2021-06 | |
dc.description.abstracten | Explanatory note of the diploma project consists of five sections, contains 27 drawings, 19 tables, 1 addition-paper and 11 sources. The diploma project is devoted to solving the problem of extracting facts from Ukrainian-language texts. The purpose of the system is to automate the process of extracting structured information from unstructured text sources by recognizing named entities. The general provisions section describes the process of extracting facts from the text, including the functional model of the system and its differences from available analogues. This section also describes the purpose of development and tasks that need to be solved. The information providing section gives a description of the input and output data, including a detailed description of the dictionary database for morphological analysis. The section of mathematical software is devoted to the substantiation of the chosen methods of solving the problem and the description of the algorithm that recognizes the named entities. The software section describes the tools for developing a software product and the stages of designing its architecture. Describes the specification of functions and reports generated during protokenTag startup. The technological section defines the purpose of software product testing and describes their results. The results of experimental studies are also presented. | uk |
dc.description.abstractuk | Пояснювальна записка дипломного проекту складається з п’яти розділів, містить 23 рисунків, 19 таблиць, 1 додаток та 18 джерел. Дипломний проект присвячений вирішенню задачі добування фактів з україномовних текстів. Метою створення системи є автоматизація процесу добування структурованої інформації з неструктурованих текстових джерел за допомогою розпізнавання іменованих сутностей для української мови. У розділі загальних положень описано процес діяльності добування фактів з тексту, функціональну модель системи та її відмінності від наявних аналогів. Визначено мету розробки та встановлено задачі, які необхідно вирішити. У розділі інформаційного забезпечення надано опис вхідних та вихідних даних, включно з детальним описом базу даних словника для проведення морфологічного аналізу. Розділ математичного забезпечення присвячений обґрунтуванню вибраних методів розв’язання задачі та опису алгоритму, який розпізнає іменовані сутності. Розділ програмного забезпечення описує засоби розробки програмного продукту та етапи проектування його архітектури. Описано специфікацію функцій та звіти, які генеруються в ході запуску програми. У технологічному розділі визначено мету проведення випробувань програмного продукту та описано їх результати. Також наведені результати експериментальних досліджень. | uk |
dc.format.page | 107 с. | uk |
dc.identifier.citation | Турко, М. В. Інформаційна система добування фактів з україномовних текстів : дипломний проєкт ... бакалавра : 126 Інформаційні системи та технології / Турко Микола Васильович. – Київ, 2021. – 107 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/46954 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | обробка природної мови | uk |
dc.subject | обробка тексту | uk |
dc.subject | розпізнавання іменованих сутностей | uk |
dc.title | Інформаційна система добування фактів з україномовних текстів | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Turko_bakalavr.pdf
- Розмір:
- 6.5 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: