Оцінка міри подібності перефразованих текстів
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота за темою «Оцінка міри подібності перефразованих текстів» виконана студентом кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Стельмахом Дмитром Юрійовичем зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія
програмного забезпечення інтелектуальних кібер-фізичних систем в енергетиці» і складається зі: вступу; 4 розділів («Теоретичні основи та постановка задачі», «Розробка системи оцінки подібності перефразованих текстів», «Дослідження ефективності системи», «Програмна реалізація та практичне застосування»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 15 джерел; 22 ілюстрацій; 3 таблиць та додатків. Загальний обсяг роботи 86 сторінок. Актуальність теми полягає у відсутності ефективних систем оцінки семантичної подібності для
української мови та браку великих анотованих датасетів перифразів. Мета роботи полягає у розробці та дослідженні ефективних методів оцінки подібності
перефразованих текстів українською мовою. Завдання дослідження включають створення датасету українських перифразів, розробку
ансамблевого підходу на основі традиційних метрик подібності, навчання нейронної мережі та створення вебсервісу для практичного застосування.
Практичне значення одержаних результатів полягає у створенні високоточної системи з коефіцієнтом детермінації R² майже 99% для застосування в освітніх системах, медіа-моніторингу та корпоративних рішеннях.
Опис
Ключові слова
обробка природної мови, оцінка подібності перефразованих текстів, векторні представлення текстів, нейронні мережі, трансформери, сіамська архітектура, українська мова, штучний інтелект, косинусна подібність, евклідова відстань, манхеттенська відстань, ансамбль метрик, машинне навчання, natural language processing, paraphrased text similarity assessment, text vector representations, neural networks, transformers, siamese architecture, Ukrainian language, artificial intelligence, cosine similarity, Euclidean distance, Manhattan distance, ensemble metrics, machine learning
Бібліографічний опис
Стельмах, Д. Ю. Оцінка міри подібності перефразованих текстів : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Стельмах Дмитро Юрійович. – Київ, 2025. – 86 с.