Методи пошуку рецептів на основі TF-IDF і ембедінгів: порівняльний аналіз
Вантажиться...
Дата
2025
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 95 стор., 14 рис., 17 посилань, 1 додаток.
Об’єктом дослідження є процес текстового інформаційного пошуку в системах, орієнтованих на користувача. Предметом дослідження є вплив спотворень у текстових запитах на якість пошуку при використанні моделей TF-IDF та Sentence-BERT. Метою роботи є порівняльний аналіз ефективності TF-IDF та
Sentence-BERT у задачі пошуку текстової інформації за спотвореними запитами. У дипломній роботі досліджується ефективність методів текстового пошуку в умовах спотворених запитів на прикладі системи пошуку кулінарних рецептів. Основна увага приділяється порівнянню класичного лексичного підходу TF-IDF та сучасного векторного пошуку за допомогою моделі Sentence–BERT. У ході роботи було реалізовано програмне забезпечення, яке дозволяє моделювати різні типи та рівні спотворень, оцінювати результати пошуку та аналізувати стійкість обох моделей. Актуальність роботи зумовлена тим, що в реальних умовах користувачі часто вводять неточні або неформалізовані запити, що істотно впливає на релевантність відповідей у пошукових системах. У роботі представлено набір експериментів із поступовим ускладненням запитів, зібрано порівняльну статистику точності, візуалізовано результати та зроблено висновки щодо переваг векторних моделей у контексті помилкового або неповного введення. Запропонований підхід можна адаптувати до інших задач семантичного пошуку, що робить роботу цінною з прикладової точки зору.
Опис
Ключові слова
tf-idf, sbert, bert, векторний пошук, ембедінги, датасет, tf-idf, sbert, bert, vector search, embeddings, dataset
Бібліографічний опис
Кимачинський, К. Д. Методи пошуку рецептів на основі TF-IDF і ембедінгів: порівняльний аналіз : дипломна робота … бакалавра : 122 Комп'ютерні науки / Кимачинський Кирил Дмитрович. – Київ, 2025. – 95 с.