Математичне та програмне забезпечення реферування тексту

Вантажиться...
Ескіз

Дата

2019-12

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського.

Анотація

Магістерська дисертація: 96 с., 10 рис., 11 табл., 5 додатків, 38 джерел. Актуальність роботи заключається в тому, що кількість застосунків, що вирішують задачу автоматичного реферування текстів, написаних українською чи російською невелика, та результати їх роботи не можна назвати дуже ефективними з точки зору математичних показників лексичної близькості текстів. Але задача реферування текстів є досить важливою зважаючи на кількість потоків текстових даних, які стають більшими кожен день і для багатьох професій – від законотворців, журналістів та, навіть, до військових критично ці потоки ефективно обробляти використовуючи менше часу. Аналогічно, реферування є важливим і для машинної обробки текстів – це значно пришвидшує обмін даними та має дуже багато потенційних аплікацій. Мета дослідження є синтез нового математичного та програмного рішення для автоматичного реферування текстів, написаних українською та російською мовами. Для реалізації поставленої мети були сформульовані наступні завдання: - Аналіз існуючого теоретичного апарату реферування текстів - Огляд існуючого програмного забезпечення - Розробка нового застосунку та моделі для реферування текстів українською та російською мовами - Виконати аналіз отриманих результатів Об’єкт дослідження: є математичні моделі автоматичного реферування тексту. Предметом дослідження є розробка застосунків, що будуть використовувати існуючі методи або нові методи автоматичного реферування текстів, написаних українською та російською мовами. Методи досліджень є методи екстрактивного реферування текстів, що базуються на векторному представленні тексту Наукова новизна: Найбільш суттєвими науковими результатами магістерської дисертації є розробка власного алгоритму реферування текстів та його імплементація для вирішення задачі реферування текстів, написаних українською та російською мовами. Практичне значення отриманих результатів визначається тим, що запропонований алгоритм та розроблений програмний застосунок у результаті експерименту показує кращі результати за існуючі підходи. Зв’язок роботи з науковими програмами, планами, темами: Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Публікації: Наукові положення дисертації опубліковані в тезах наукової конференції студентів, магістрантів та аспірантів «Інформатика та обчислювальна техніка» – ІОТ-2019

Опис

Ключові слова

автоматичне реферування текстів, екстрактивні методи реферування, textrank, латентно-семантичний аналіз, математичні моделі представлення текстів, automatic text summarization, extractive text summarization methods, textrank, latent-semantic analysis, mathematical models of text representation

Бібліографічний опис

Аршакян, Г. Д. Математичне та програмне забезпечення реферування тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Аршакян Георгій Давидович. - Київ, 2019. - 96 с.

ORCID

DOI