Стативка, Юрій ІвановичСтельмах, Дмитро Юрійович2025-07-102025-07-102025Стельмах, Д. Ю. Оцінка міри подібності перефразованих текстів : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Стельмах Дмитро Юрійович. – Київ, 2025. – 86 с.https://ela.kpi.ua/handle/123456789/74848Дипломна робота за темою «Оцінка міри подібності перефразованих текстів» виконана студентом кафедри інженерії програмного забезпечення в енергетиці НН ІАТЕ Стельмахом Дмитром Юрійовичем зі спеціальності 121 «Інженерія програмного забезпечення» за освітньо-професійною програмою «Інженерія програмного забезпечення інтелектуальних кібер-фізичних систем в енергетиці» і складається зі: вступу; 4 розділів («Теоретичні основи та постановка задачі», «Розробка системи оцінки подібності перефразованих текстів», «Дослідження ефективності системи», «Програмна реалізація та практичне застосування»), висновків до кожного з цих розділів; загальних висновків; списку використаних джерел, який налічує 15 джерел; 22 ілюстрацій; 3 таблиць та додатків. Загальний обсяг роботи 86 сторінок. Актуальність теми полягає у відсутності ефективних систем оцінки семантичної подібності для української мови та браку великих анотованих датасетів перифразів. Мета роботи полягає у розробці та дослідженні ефективних методів оцінки подібності перефразованих текстів українською мовою. Завдання дослідження включають створення датасету українських перифразів, розробку ансамблевого підходу на основі традиційних метрик подібності, навчання нейронної мережі та створення вебсервісу для практичного застосування. Практичне значення одержаних результатів полягає у створенні високоточної системи з коефіцієнтом детермінації R² майже 99% для застосування в освітніх системах, медіа-моніторингу та корпоративних рішеннях.86 с.ukобробка природної мовиоцінка подібності перефразованих текстіввекторні представлення текстівнейронні мережітрансформерисіамська архітектураукраїнська моваштучний інтелекткосинусна подібністьевклідова відстаньманхеттенська відстаньансамбль метрикмашинне навчанняnatural language processingparaphrased text similarity assessmenttext vector representationsneural networkstransformerssiamese architectureUkrainian languageartificial intelligencecosine similarityEuclidean distanceManhattan distanceensemble metricsmachine learningОцінка міри подібності перефразованих текстівBachelor Thesis