Розробка засобів автоматичного реферування текстів
dc.contributor.advisor | Киселльов, Геннадій Дмитрович | |
dc.contributor.author | Кузнєцов, Олексій Андрійович | |
dc.date.accessioned | 2023-02-07T10:42:22Z | |
dc.date.available | 2023-02-07T10:42:22Z | |
dc.date.issued | 2022-12 | |
dc.description.abstracten | The total amount of work is pages 107, figures 19, tables 22, appendices 1, sources 42 . The relevance of the topic of the master's thesis lies in the fact that there are not so many systems of automatic abstracting of texts in free access, although this topic is quite relevant, for those who need to classify or cluster large volumes of text, or for those who need to quickly get a short summary from some document for further use. Thus, the decision was made to create my own automatic annotation system using only publicly available programming languages and tools. The aim and objectives of the research. The purpose of this work is to check the effectiveness of the main approaches to automatic text abstracting, as well as research different methods for different text abstracting approaches and create a layout of a text abstracting program. The set goal requires solving the following scientific problems: 1) Analysis of known mathematical methods that can be used for abstracting texts; 2) Analysis of natural speech processing methods; 3) Development of a model of automatic abstracting of texts, which will allow to evaluate the tonality of the text, cluster or classify it, find different nominal essences in it, and also find hidden themes. Object of research: the process of abstracting the text. The subject of research: a system in the Python programming language for automatic reframing of texts. Scientific novelty. Since this niche is not popular enough and there are not many web applications, any new product can bring something new to our system, the main advantage of the developed system is speed, since python allows you to create programs that work at a high speed, and such quality, since not bare data was used, but training models. Potential applications and practical value of the results of the master's work: A mechanism for automatic referencing of texts has been developed, on the basis of which it is possible to improve already existing mechanisms of this type; The developed application can be further modernized by adding new features to the existing ones; This system can also be used in the educational system, it will allow students to get a short analysis, which can make it easier for them to consume information. Publication: 1. Methods of recognizing texts and finding keywords for automatic abstracting of texts / O. Kuznietsov, G. Kiselyov // System sciences and informatics: collection of reports of the 1st scientific and practical conference "System sciences and informatics", November 22–29, 2022, Kyiv. – K., ES IASA KPI named after Igor Sikorskyi, 2022. - p. 331-335. | uk |
dc.description.abstractuk | Загальний обсяг роботи с.107, рис. 19, таблиць 22, додатки 1, джерел 42. Актуальність теми магістерської дисертації полягає у тому, що не так багато систем автоматичного реферування текстів є в вільному доступі, хоча ця тема досить актуальна, для тих, кому потрібно класифікувати чи кластеризувати великі об'єми тексту, або для тих кому треба швидко отримати коротку вижимку з якогось документу для подальшого використання. Таким чином було прийняте рішення про створення своєї власної системи автоматичного анотування, використовуючи лише загальнодоступні мови програмування та інструменти. Метою та задачі дослідження. Метою цієї роботи є перевірка ефективності основних підходів до автоматичного реферування тексту, а також дослідження різних методів для різних підходів реферування тексту і створення макету програми для реферування текстів. Поставлена мета вимагає вирішення наступних наукових задач : 1) Аналіз відомих математичних методів, які можна буде використати для реферування текстів; 2) Аналіз методів обробки природного мовлення; 3) Розробка моделі автоматичного реферування текстів, що дозволить оцінити тональність тексту, кластеризувати чи класифікувати його, знайти в ньому різні іменні сутномті, а такоє знайти приховані тематики. Об’єкт досліджень: процес реферування тексту. Предмет досліджень: система на мові програмування пайтон для автоматичного реферуфання текстів. Наукова новизна. Так як ця ніша не досить популярна і немає багато веб застосунків, то будь який новий продукт зможе привнести щось нове у нашу систему, основна перевага розробленої системи це швидкість, так як пайтон дозволяє створювати програми, що працюють з великою швидкістю, а такоє якість, так як були використані не голі дані, а навченні моделі. Потенційні застосування та практична цінність результатів магістерської роботи: Розроблений механізм автоматичного реферування текстів, на основі якого можна покращити вже існуючі механізми цього типу; Розроблений застосунок можна і надалі модернізувати додаючі нові можливості до вже існуючих; Цю систему також можна використовувати і в освітній системі, вона дозволить студентам отримувати короткий аналіз, що може спростити їм споживання інформації. Публікація: 1. Методи розпізнавання текстів та пошуку ключових слів для автоматичного реферування текстів / Кузнєцов О.А, Кисельов Г.Д. // Системні науки та інформатика: збірник доповідей І науково-практичної конференції «Системні науки та інформатика», 22–29 листопада 2022 року, Київ. – К., НН ІПСА КПІ ім. Ігоря Сікорського, 2022. – с. 331-335. | uk |
dc.format.page | 107 с. | uk |
dc.identifier.citation | Кузнєцов, О. А. Розробка засобів автоматичного реферування текстів : магістерська дис. : 122 Комп'ютерні науки / Кузнєцов Олексій Андрійович. - Київ, 2022. - 107 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/52399 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | реферування текстів | uk |
dc.subject | добуваючий підхід | uk |
dc.subject | тональність | uk |
dc.subject | іменованні сутності | uk |
dc.subject | абстрактний підхід | uk |
dc.subject | метод тематичних слів | uk |
dc.subject | центрування речень | uk |
dc.subject | індикаторні представлення | uk |
dc.subject | класифікація | uk |
dc.subject | кластеризація | uk |
dc.subject | тематичне моделювання | uk |
dc.subject | entity naming | uk |
dc.subject | abstracting of texts | uk |
dc.subject | extractive approach | uk |
dc.subject | abstract approach | uk |
dc.subject | method of thematic words | uk |
dc.subject | sentence centering | uk |
dc.subject | indicator representations | uk |
dc.subject | classification | uk |
dc.subject | clustering | uk |
dc.subject | thematic modeling | uk |
dc.subject | tonality | uk |
dc.subject.udc | 004.42 | uk |
dc.title | Розробка засобів автоматичного реферування текстів | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kuznietsov_magistr.pdf
- Розмір:
- 2.43 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: