Оцінка міри подібності перефразованих текстів

Вантажиться...
Ескіз

Дата

2025

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота за темою «Оцінка міри подібності перефразованих текстів» виконана студентом кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Стельмахом Дмитром Юрійовичем зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем в енергетиці» і складається зі: вступу; 4 розділів («Теоретичні основи та постановка задачі», «Розробка системи оцінки подібності перефразованих текстів», «Дослідження ефективності системи», «Програмна реалізація та практичне застосування»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 15 джерел; 22 ілюстрацій; 3 таблиць та додатків. Загальний обсяг роботи 86 сторінок. Актуальність теми полягає у відсутності ефективних систем оцінки семантичної подібності для української мови та браку великих анотованих датасетів перифразів. Мета роботи полягає у розробці та дослідженні ефективних методів оцінки подібності перефразованих текстів українською мовою. Завдання дослідження включають створення датасету українських перифразів, розробку ансамблевого підходу на основі традиційних метрик подібності, навчання нейронної мережі та створення вебсервісу для практичного застосування. Практичне значення одержаних результатів полягає у створенні високоточної системи з коефіцієнтом детермінації R² майже 99% для застосування в освітніх системах, медіа-моніторингу та корпоративних рішеннях.

Опис

Ключові слова

обробка природної мови, оцінка подібності перефразованих текстів, векторні представлення текстів, нейронні мережі, трансформери, сіамська архітектура, українська мова, штучний інтелект, косинусна подібність, евклідова відстань, манхеттенська відстань, ансамбль метрик, машинне навчання, natural language processing, paraphrased text similarity assessment, text vector representations, neural networks, transformers, siamese architecture, Ukrainian language, artificial intelligence, cosine similarity, Euclidean distance, Manhattan distance, ensemble metrics, machine learning

Бібліографічний опис

Стельмах, Д. Ю. Оцінка міри подібності перефразованих текстів : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Стельмах Дмитро Юрійович. – Київ, 2025. – 86 с.

ORCID

DOI