Навчання мовної моделі для створення заголовків статей на основі їх змісту

Вишемірський, Антон Ігорович

Навчання мовної моделі для створення заголовків статей на основі їх змісту

dc.contributor.advisor	Дмитрієва, Ольга Анатоліївна
dc.contributor.author	Вишемірський, Антон Ігорович
dc.date.accessioned	2024-11-18T09:16:11Z
dc.date.available	2024-11-18T09:16:11Z
dc.date.issued	2024
dc.description.abstract	Дипломна робота: 87 с., 6 табл., 23 рис., 2 додатки, 17 джерел. Ключові слова: мовна модель, технології обробки природної мови, генерація тексту, трансформери, валідація моделі, нейронні мережі, машинне навчання. Об’єктом дослідження є процес тренування переднавченої моделі для генерації назв статей із текстового змісту за допомогою технологій обробки природної мови (NLP) та машинного навчання. Предметом дослідження є алгоритми та методи машинного навчання та обробки природної мови (NLP), які використовуються для аналізу тексту статей та автоматизації процесу генерації відповідних і змістовних заголовків. Мета роботи полягає у реалізації процесів тренування та оцінювання отриманих результатів. Для досягнення поставленої мети і автоматизації процесу в роботі передбачено розробку вебзастосунку. Розроблений програмний продукт орієнтований на визначення тематики текстових масивів даних, розпізнавання ключових ідей, що містяться у тексті, генерування заголовків, які адекватно відображають основний зміст статті та привертають увагу потенційних читачів. Методи розробки базувалися на використанні основних положень теорії алгоритмів, систем штучного інтелекту та проєктування програмного забезпечення. Для розпізнавання ключових ідей і визначення тематики текстових масивів даних було застосовано підходи, на яких ґрунтуються теорія обробки природної мови, теорія машинного навчання. Дослідження і оцінювання основних результатів роботи здійснювалися із залученням положень математичної статистики і інтелектуального аналізу даних. Практичне значення полягає в створенні програмного застосунку для підтримки процесу генерування заголовків статей, привернення уваги потенційних читачів та підвищення загальної продуктивності.
dc.description.abstractother	Diploma thesis: 87 p., 6 tables, 23 figures, 2 appendices, 17 references. Keywords: language model, natural language processing technologies, text generation, transformers, model validation, neural networks, machine learning. The object of the research is the process of training a pre-trained model to generate article titles from textual content using natural language processing (NLP) technologies and machine learning. The subject of the research is the set of algorithms and methods of machine learning and natural language processing (NLP) used to analyze article text and automate the process of generating appropriate and meaningful headlines. The goal of the work is to implement the processes of training and evaluating the obtained results. To achieve this goal and automate the process, the work includes the development of a web application. The developed software product is aimed at identifying the topics of text data arrays, recognizing the key ideas contained in the text, generating headlines that adequately reflect the main content of the article and attract potential readers' attention. The development methods were based on the use of the fundamental principles of algorithm theory, artificial intelligence systems, and software design. To recognize key ideas and determine the topics of text data arrays, approaches based on the theory of natural language processing and machine learning were applied. The research and evaluation of the main results of the work were conducted using principles of mathematical statistics and data mining. The practical significance lies in the creation of a software application to support the process of generating article headlines, attracting the attention of potential readers, and increasing overall productivity.
dc.format.extent	87 с.
dc.identifier.citation	Вишемірський, А. І. Навчання мовної моделі для створення заголовків статей на основі їх змісту : дипломна робота ... бакалавра : 124 Системний аналіз / Вишемірський Антон Ігорович. - Київ, 2024. - 87 с.
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/70644
dc.language.iso	uk
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.subject	мовна модель
dc.subject	технології обробки природної мови
dc.subject	генерація тексту
dc.subject	трансформери
dc.subject	валідація моделі
dc.subject	нейронні мережі
dc.subject	машинне навчання
dc.subject	language model
dc.subject	natural language processing technologies
dc.subject	text generation
dc.subject	transformers
dc.subject	model validation
dc.subject	neural networks
dc.subject	machine learning
dc.title	Навчання мовної моделі для створення заголовків статей на основі їх змісту
dc.type	Bachelor Thesis

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Vyshemirskyi_bakalavr.pdf
Розмір:: 5.02 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (ММСА)
Бакалаврські роботи