Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей

dc.contributor.advisorНедашківська, Надія Іванівна
dc.contributor.authorКоберник, Андрій Олександрович
dc.date.accessioned2024-09-19T08:42:27Z
dc.date.available2024-09-19T08:42:27Z
dc.date.issued2024
dc.description.abstractДипломна робота: 140 с., 14 табл., 21 рис., 2 додатки, 23 джерела. Об'єкт дослідження - порівняння ембедінг моделей для задачі векторизації тексту з максимальним збереженням сенсу та семантики. Аналіз точності пошуку при використанні різних моделей. Аналіз надання додаткового контексту на вхід великих мовних моделей і його вплив на якість і точність генерації кінцевого результату у задачі відповіді на питання. У сучасному світі обсяг інформації, і її доступність стрімко зростає, що ускладнює її ефективний пошук і обробку. Ефективні системи пошуку у поєднанні з моделями генерації відповідей можуть значно покращити досвід користувачів у використанні персональних асистентів та систем пошуку. Метою цієї роботи є розробка та аналіз системи, яка використовує векторний пошук для подання релевантної інформації у вхідний контекст великих мовних моделей, для отримання відповідей на основі цього контексту, проаналізувати чи покращується якість згенерованих відповідей. Система інтегрує ембедінг моделі для векторизації тексту та великі мовні моделі для генерації відповідей, що дозволяє отримати точніші і контекстуально релевантні відповіді без необхідності додаткового навчання. Ця система спрямована на покращення точності відповідей мовних моделей шляхом використання ембедінг та великих мовних моделей, векторних баз даних, що дозволяє ефективно здійснювати пошук релевантної інформації та покращує якість генерації відповідей. Такий підхід значно підвищує ефективність систем, роблячи їх роботу ефективною. Розроблено програмний продукт на мові програмування Python.
dc.description.abstractotherThesis: 140 p., 14 t., 21 fig., 2 append., 23 references. Object of research - comparison of embedding models for the task of text vectorisation with maximum preservation of meaning and semantics. Analysis of search accuracy when using different models. Analysis of providing additional context to the input of large language models and its impact on the quality and accuracy of generating the final result in the task of answering a question. In today's world, the amount of information and its availability is growing rapidly, which makes it difficult to find and process it efficiently. Efficient search systems combined with answer generation models can significantly improve the user experience of personal assistants and search engines. The aim of this paper is to develop and analyse a system that uses vector search to provide relevant information in the input context of large language models, to retrieve answers based on this context, and to analyse whether the quality of the generated answers improves. The system integrates embedding models for text vectorisation and large language models for answer generation, which allows for more accurate and contextually relevant answers without the need for additional training. This system aims to improve the accuracy of language model responses by using embedding and large language models, vector databases, which allows for efficient search for relevant information and improves the quality of response generation. This approach significantly improves the efficiency of the systems, making their work effective. A software product was developed in the Python programming language.
dc.format.extent140 с.
dc.identifier.citationКоберник, А. О. Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей : дипломна робота ... бакалавра : 124 Системний аналіз / Коберник Андрій Олександрович. – Київ, 2024. – 140 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/69042
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectвеликі мовні моделі
dc.subjectембедінг моделі
dc.subjectсистема пошуку
dc.subjectвекторна база даних
dc.subjectlarge language models
dc.subjectembedding models
dc.subjectsearch system
dc.subjectvector database
dc.titleАналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Kobernyk_bakalavr.pdf
Розмір:
4.98 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: