Математичне та програмне забезпечення реферування тексту

dc.contributor.advisorОлійник, Юрій Олександрович
dc.contributor.authorАршакян, Георгій Давидович
dc.date.accessioned2020-02-14T14:00:48Z
dc.date.available2020-02-14T14:00:48Z
dc.date.issued2019-12
dc.description.abstractenMaster dissertation: 96 pp., 10 figures, 11 tables, 5 applications, 38 sources. Topicality is concluded with that the number of applications that solve the problem of automatic abstract generation for the texts written in Ukrainian or Russian is extremely small, and the results of their work can not be called very effective in terms of mathematical indicators of the lexical proximity of texts. But the task of text summarization is quite important, especially given the number of textual data streams that are growing every day and for many professions - from lawmakers, journalists, and even the military – it’s critical to process these streams faster. Similarly, abstracting is important for word processing - it greatly speeds up data exchange and has many potential applications. The aim of the research is synthesis of a new mathematical and software solution for automatic abstracting of texts written in Ukrainian and Russian. To achieve this goal which were formulated following tasks: - Existing theoretical methods of text summarization analysis - Review of existing text summarization software - Development of a new application and mathematical model for Russian and Ukrainian texts summarization - Perform the analysis of the obtained results The object of research is the mathematical models for automatic text summarization The subject of research is the development of applications that will use existing methods or new methods of automatic text summarization of texts written in Ukrainian and Russian. Research methods are the extraction methods of the text summarization based on the vector representation of the text Scientific novelty of the obtained results. The most significant scientific results of the master's thesis are the development of its own algorithm for abstracting texts and its implementation to solve the problem of abstracting texts written in Ukrainian and Russian. Practical consequences of the results are determined by the fact that the proposed algorithm and the developed software application as a result of the experiment show better results than the existing approaches. Relationship of work with scientific programs, plans, themes: The work was performed at the Department of Automated Information Processing and Management Systems of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky ”within the topic“ Methods and technologies of high-performance computing and processing of large data sets ”. State Registration Number 0117U000924. Publications: The research results were published in the thesіs of the scientific conference of students, undergraduates and graduate students "Computer Science and Computer Engineering" - IOT-2019[27].uk
dc.description.abstractukМагістерська дисертація: 96 с., 10 рис., 11 табл., 5 додатків, 38 джерел. Актуальність роботи заключається в тому, що кількість застосунків, що вирішують задачу автоматичного реферування текстів, написаних українською чи російською невелика, та результати їх роботи не можна назвати дуже ефективними з точки зору математичних показників лексичної близькості текстів. Але задача реферування текстів є досить важливою зважаючи на кількість потоків текстових даних, які стають більшими кожен день і для багатьох професій – від законотворців, журналістів та, навіть, до військових критично ці потоки ефективно обробляти використовуючи менше часу. Аналогічно, реферування є важливим і для машинної обробки текстів – це значно пришвидшує обмін даними та має дуже багато потенційних аплікацій. Мета дослідження є синтез нового математичного та програмного рішення для автоматичного реферування текстів, написаних українською та російською мовами. Для реалізації поставленої мети були сформульовані наступні завдання: - Аналіз існуючого теоретичного апарату реферування текстів - Огляд існуючого програмного забезпечення - Розробка нового застосунку та моделі для реферування текстів українською та російською мовами - Виконати аналіз отриманих результатів Об’єкт дослідження: є математичні моделі автоматичного реферування тексту. Предметом дослідження є розробка застосунків, що будуть використовувати існуючі методи або нові методи автоматичного реферування текстів, написаних українською та російською мовами. Методи досліджень є методи екстрактивного реферування текстів, що базуються на векторному представленні тексту Наукова новизна: Найбільш суттєвими науковими результатами магістерської дисертації є розробка власного алгоритму реферування текстів та його імплементація для вирішення задачі реферування текстів, написаних українською та російською мовами. Практичне значення отриманих результатів визначається тим, що запропонований алгоритм та розроблений програмний застосунок у результаті експерименту показує кращі результати за існуючі підходи. Зв’язок роботи з науковими програмами, планами, темами: Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Публікації: Наукові положення дисертації опубліковані в тезах наукової конференції студентів, магістрантів та аспірантів «Інформатика та обчислювальна техніка» – ІОТ-2019uk
dc.format.page96 с.uk
dc.identifier.citationАршакян, Г. Д. Математичне та програмне забезпечення реферування тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Аршакян Георгій Давидович. - Київ, 2019. - 96 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/31614
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорського.uk
dc.publisher.placeКиївuk
dc.subjectавтоматичне реферування текстівuk
dc.subjectекстрактивні методи реферуванняuk
dc.subjecttextrankuk
dc.subjectлатентно-семантичний аналізuk
dc.subjectматематичні моделі представлення текстівuk
dc.subjectautomatic text summarizationuk
dc.subjectextractive text summarization methodsuk
dc.subjecttextrankuk
dc.subjectlatent-semantic analysisuk
dc.subjectmathematical models of text representationuk
dc.subject.udc004.912uk
dc.titleМатематичне та програмне забезпечення реферування текстуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Arshakian_magistr.pdf
Розмір:
2.62 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: