Навчання мовної моделі для створення заголовків статей на основі їх змісту

dc.contributor.advisorДмитрієва, Ольга Анатоліївна
dc.contributor.authorВишемірський, Антон Ігорович
dc.date.accessioned2024-11-18T09:16:11Z
dc.date.available2024-11-18T09:16:11Z
dc.date.issued2024
dc.description.abstractДипломна робота: 87 с., 6 табл., 23 рис., 2 додатки, 17 джерел. Ключові слова: мовна модель, технології обробки природної мови, генерація тексту, трансформери, валідація моделі, нейронні мережі, машинне навчання. Об’єктом дослідження є процес тренування переднавченої моделі для генерації назв статей із текстового змісту за допомогою технологій обробки природної мови (NLP) та машинного навчання. Предметом дослідження є алгоритми та методи машинного навчання та обробки природної мови (NLP), які використовуються для аналізу тексту статей та автоматизації процесу генерації відповідних і змістовних заголовків. Мета роботи полягає у реалізації процесів тренування та оцінювання отриманих результатів. Для досягнення поставленої мети і автоматизації процесу в роботі передбачено розробку вебзастосунку. Розроблений програмний продукт орієнтований на визначення тематики текстових масивів даних, розпізнавання ключових ідей, що містяться у тексті, генерування заголовків, які адекватно відображають основний зміст статті та привертають увагу потенційних читачів. Методи розробки базувалися на використанні основних положень теорії алгоритмів, систем штучного інтелекту та проєктування програмного забезпечення. Для розпізнавання ключових ідей і визначення тематики текстових масивів даних було застосовано підходи, на яких ґрунтуються теорія обробки природної мови, теорія машинного навчання. Дослідження і оцінювання основних результатів роботи здійснювалися із залученням положень математичної статистики і інтелектуального аналізу даних. Практичне значення полягає в створенні програмного застосунку для підтримки процесу генерування заголовків статей, привернення уваги потенційних читачів та підвищення загальної продуктивності.
dc.description.abstractotherDiploma thesis: 87 p., 6 tables, 23 figures, 2 appendices, 17 references. Keywords: language model, natural language processing technologies, text generation, transformers, model validation, neural networks, machine learning. The object of the research is the process of training a pre-trained model to generate article titles from textual content using natural language processing (NLP) technologies and machine learning. The subject of the research is the set of algorithms and methods of machine learning and natural language processing (NLP) used to analyze article text and automate the process of generating appropriate and meaningful headlines. The goal of the work is to implement the processes of training and evaluating the obtained results. To achieve this goal and automate the process, the work includes the development of a web application. The developed software product is aimed at identifying the topics of text data arrays, recognizing the key ideas contained in the text, generating headlines that adequately reflect the main content of the article and attract potential readers' attention. The development methods were based on the use of the fundamental principles of algorithm theory, artificial intelligence systems, and software design. To recognize key ideas and determine the topics of text data arrays, approaches based on the theory of natural language processing and machine learning were applied. The research and evaluation of the main results of the work were conducted using principles of mathematical statistics and data mining. The practical significance lies in the creation of a software application to support the process of generating article headlines, attracting the attention of potential readers, and increasing overall productivity.
dc.format.extent87 с.
dc.identifier.citationВишемірський, А. І. Навчання мовної моделі для створення заголовків статей на основі їх змісту : дипломна робота ... бакалавра : 124 Системний аналіз / Вишемірський Антон Ігорович. - Київ, 2024. - 87 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/70644
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectмовна модель
dc.subjectтехнології обробки природної мови
dc.subjectгенерація тексту
dc.subjectтрансформери
dc.subjectвалідація моделі
dc.subjectнейронні мережі
dc.subjectмашинне навчання
dc.subjectlanguage model
dc.subjectnatural language processing technologies
dc.subjecttext generation
dc.subjecttransformers
dc.subjectmodel validation
dc.subjectneural networks
dc.subjectmachine learning
dc.titleНавчання мовної моделі для створення заголовків статей на основі їх змісту
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Vyshemirskyi_bakalavr.pdf
Розмір:
5.02 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: