Методи та засоби семантичного аналізу текстів
dc.contributor.advisor | Олійник, Юрій Олександрович | |
dc.contributor.author | Мигаль, Дмитро Степанович | |
dc.date.accessioned | 2021-03-09T14:53:28Z | |
dc.date.available | 2021-03-09T14:53:28Z | |
dc.date.issued | 2020-12 | |
dc.description.abstracten | Master's dissertation: 91 pp., 39 figs., 8 tables, 14 sources, 1 appendix. Topicality. The creation of new methods of semantic analysis of texts will open new opportunities and allow us to significantly progress in solving many problems of computational linguistics, such as machine translation, authoring, text classification, etc. No less important is the development of new tools and instruments to automate semantic analysis. Such analysis methods allow us to collect basic information about the subject, focus, and mood of the texts, further simplifying the automated work with them, such as cataloging, search, and comparison. The use of semantic models is relevant in automated learning systems, extracting knowledge from texts, information retrieval, abstracting, checking the correctness of dictionaries of terms and definitions, automatic generation of associative links in hypertext databases, and more. Connection of work with scientific programs, plans, themes. The work was performed at the Department of Automated Information Processing and Control Systems of the National Technical University of Ukraine "Kyiv Polytechnic Institute. Igor Sikorsky ”within the theme“ Methods and means of semantic analysis of texts ”. The purpose of the work - improving the quality of semantic analysis of Ukrainian-language texts by improving the semantic models and models of grammar of the Ukrainian language, taking into account the subject area of the text. To achieve this goal you must perform the following tasks: – analysis of modern methods and means of semantic texts analysis; – review of existing resources for processing and analysis of Ukrainian-language texts; – development of the LSA method with support for processing Ukrainian-language texts; – review and selection of technologies for the implementation of methods and tools; – software development; – study of the effectiveness of the developed method and software. The object of research is mathematical, informational and software of human-machine communication in the Ukrainian language. The subject of the research are models and methods of semantic analysis of the Ukrainian text. The research methods used in this paper are based on the methods of semantic analysis of texts. Scientific novelty - improved methods of semantic analysis, which include support for processing Ukrainian-language texts. Applied significance. Methods and software can be used for semantic analysis of data of Ukrainian-language texts, which is supported by the draft concept of development of artificial intelligence of Ukraine. Publications. The materials of the work are published in the abstracts of the international scientific-practical conference "TOPICAL ISSUES OF THE DEVELOPMENT OF MODERN SCIENCE" and in the abstracts of the scientific-practical conference "Informatics and Computer Engineering-IOT-2020". | uk |
dc.description.abstractuk | Магістерська дисертація: 91 с., 39 рис., 8 табл., 22 джерела, 1 додаток. Актуальність. У подальшому майбутньому, створення нових методів семантичного аналізу текстів відкриє нові можливості та дозволить істотно просунутися у вирішенні багатьох завдань прикладної лінгвістики, таких як машинний переклад, автореферування, класифікація текстів і т.п. Не менш актуальною є і розробка нових засобів та інструментів, що дозволяють автоматизувати семантичний аналіз. Подібні методи аналізу дозволяють збирати основну інформацію про певну тематику, спрямованість і настрій текстів, що в подальшому буде спрощувати автоматизовану роботу з ними, таку як каталогізація, пошук і порівняння. Застосування семантичних моделей є актуальним в автоматизованих навчальних системах, при вирішенні певних задач, таких як: вилучення знань з текстів, інформаційного пошуку, реферування, контролю коректності словникових термінів і визначень, автоматичної генерації асоціативних зв’язків в гіпертекстових базах даних тощо. Зв'язок роботи з науковими програмами, планами, темами. Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Мета роботи – підвищення якості семантичного аналізу україномовних текстів за рахунок вдосконалення семантичних моделей та моделей граматики української мови з урахуванням предметної області тексту. Для досягнення мети необхідно виконати наступні завдання: – аналіз сучасних методів та засобів семантичного аналізу текстів; – огляд наявних ресурсів обробки та аналізу україномовних текстів; – розробка методу LSA з підтримкою обробки україномовних текстів; – огляд та обґрунтування вибору технологій для реалізації методів та засобів; – розробка програмного забезпечення; – дослідження ефективності розробленого методу та програмного забезпечення. Об'єктом дослідження роботи є математичне, інформаційне та програмне забезпечення людино-машинного спілкування українською мовою. Предметом дослідження є моделі і методи семантичного аналізу україномовного тексту. Методи дослідження, застосовані у даній роботі, базуються на методах семантичного аналізу текстів. Наукова новизна – вдосконалені методи семантичного аналізу, що містять підтримку обробки україномовних текстів. Прикладна значущість. Методи та програмне забезпечення може бути використане для семантичного аналізу даних україномовних текстів, що підтримано проектом концепції розвитку штучного інтелекту України. Публікації. Матеріали роботи опубліковані в тезах міжнародної науково-практичної конференції «TOPICAL ISSUES OF THE DEVELOPMENT OF MODERN SCIENCE» та у тезах науково-практичної конференції «Інформатика та обчислювальна техніка-ІОТ-2020». | uk |
dc.format.page | 91 с. | uk |
dc.identifier.citation | Мигаль, Д. С. Методи та засоби семантичного аналізу текстів : магістерська дис. : 126 Інформаційні системи та технології / Мигаль Дмитро Степанович. – Київ, 2020. – 91 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/39855 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | семантичний аналіз | uk |
dc.subject | тематичне моделювання | uk |
dc.subject | українська мова | uk |
dc.subject | latent semantic analysis | uk |
dc.subject | natural language processing | uk |
dc.subject | semantic analysis | uk |
dc.subject | thematic modeling | uk |
dc.subject | Ukrainian language | uk |
dc.subject.udc | 004.089 | uk |
dc.title | Методи та засоби семантичного аналізу текстів | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Myhal_magistr.pdf
- Розмір:
- 3.82 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: