Модуль аналітичного опрацювання текстів українською мовою
Ескіз недоступний
Дата
2020-12
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Робота складається із вступу та чотирьох розділів. Загальний обсяг роботи: 98 аркушів основного тексту, 32 ілюстрації, 23 таблиці. При підготовці використовувалася література з 35 різних джерел. Актуальність. Аналіз тексту є дуже популярним напрямом уже протягом багатьох років. Він використовується для отримання інформації, інформаційного пошуку, аналізу мовлення, тону текста, широко використовується в системах питання-відповідь. Другий подих технологія отримала після поширення нейронних мереж. За допомогою них стало можливим створювати нейронні моделі, що будуть аналізувати текст. Такий підхід значно покращив якість аналізу тексту. У попередніх, евристичних, підходах, якщо не було описано потрібного правила, то на виході отримували негативний результат. Нейронні мережі ж, коли стикаються з незнайомими сутностями, можуть приймати рішення на основі припущень із певною ймовірністю.
Мета і завдання дослідження. Метою магістерської роботи є розроблення модуля аналізу текстів українською мовою, що зможе якісно аналізувати текст та, відповідно, оброблювати його, на прикладі вилучення з нього іменованих сутностей.
Для досягнення мети поставлено і вирішено такі завдання:
опис необхідного мінімального функціоналу та порівняння за ним існуючих аналогів; розробка архітектури та опис інтерфейсу користувача; розробка додатку, що прийматиме запити від користувача з вхідним текстом та повертатиме бажану, у залежності від налаштування запиту, відповідь; демонстрація роботи додатку, аналіз результатів.
Об’єкт дослідження – процес обробки вхідного тексту для отримання певної інформації.
Предмет дослідження – тексти українською мовою. Методи досліджень. Для досягнення поставлених в магістерській роботі задач було розроблено архітектуру і реалізовано додаток для обробки текстів, що дозволяє приймати запити з текстом від користувача, визначати мову тексту, оброблювати його в залежності від запиту та повертати відповідь. До того ж додаток дозволяє просто підключати сервіси з іншими мовами до існуючого додатку та оновлювати їх без перезавантаження серверу, що приймає запити від користувача.
Особистий внесок здобувача. Магістерське дослідження є самостійно виконаною роботою, в якій відображено авторський підхід та особисто отримані прикладний результат у вигляді готового додатку. Формулювання мети та завдань дослідження проводилось спільно з науковим керівником.
Практична цінність. Розроблений додаток надасть якісний аналіз текстів українською мовою в майбутніх дослідженнях. Також дозволяє достатньо легко додавати можливості роботи з іншими мовами.
Опис
Ключові слова
аналіз текстів українською мовою, вилучення іменованих сутностей, нейронна модель
Бібліографічний опис
Попов, С. І. Модуль аналітичного опрацювання текстів українською мовою : магістерська дис. : 121 Інженерія програмного забезпечення / Попов Станіслав Ігорович. – Київ, 2020. – 98 с.