Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей

Коберник, Андрій Олександрович

Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей

dc.contributor.advisor	Недашківська, Надія Іванівна
dc.contributor.author	Коберник, Андрій Олександрович
dc.date.accessioned	2024-09-19T08:42:27Z
dc.date.available	2024-09-19T08:42:27Z
dc.date.issued	2024
dc.description.abstract	Дипломна робота: 140 с., 14 табл., 21 рис., 2 додатки, 23 джерела. Об'єкт дослідження - порівняння ембедінг моделей для задачі векторизації тексту з максимальним збереженням сенсу та семантики. Аналіз точності пошуку при використанні різних моделей. Аналіз надання додаткового контексту на вхід великих мовних моделей і його вплив на якість і точність генерації кінцевого результату у задачі відповіді на питання. У сучасному світі обсяг інформації, і її доступність стрімко зростає, що ускладнює її ефективний пошук і обробку. Ефективні системи пошуку у поєднанні з моделями генерації відповідей можуть значно покращити досвід користувачів у використанні персональних асистентів та систем пошуку. Метою цієї роботи є розробка та аналіз системи, яка використовує векторний пошук для подання релевантної інформації у вхідний контекст великих мовних моделей, для отримання відповідей на основі цього контексту, проаналізувати чи покращується якість згенерованих відповідей. Система інтегрує ембедінг моделі для векторизації тексту та великі мовні моделі для генерації відповідей, що дозволяє отримати точніші і контекстуально релевантні відповіді без необхідності додаткового навчання. Ця система спрямована на покращення точності відповідей мовних моделей шляхом використання ембедінг та великих мовних моделей, векторних баз даних, що дозволяє ефективно здійснювати пошук релевантної інформації та покращує якість генерації відповідей. Такий підхід значно підвищує ефективність систем, роблячи їх роботу ефективною. Розроблено програмний продукт на мові програмування Python.
dc.description.abstractother	Thesis: 140 p., 14 t., 21 fig., 2 append., 23 references. Object of research - comparison of embedding models for the task of text vectorisation with maximum preservation of meaning and semantics. Analysis of search accuracy when using different models. Analysis of providing additional context to the input of large language models and its impact on the quality and accuracy of generating the final result in the task of answering a question. In today's world, the amount of information and its availability is growing rapidly, which makes it difficult to find and process it efficiently. Efficient search systems combined with answer generation models can significantly improve the user experience of personal assistants and search engines. The aim of this paper is to develop and analyse a system that uses vector search to provide relevant information in the input context of large language models, to retrieve answers based on this context, and to analyse whether the quality of the generated answers improves. The system integrates embedding models for text vectorisation and large language models for answer generation, which allows for more accurate and contextually relevant answers without the need for additional training. This system aims to improve the accuracy of language model responses by using embedding and large language models, vector databases, which allows for efficient search for relevant information and improves the quality of response generation. This approach significantly improves the efficiency of the systems, making their work effective. A software product was developed in the Python programming language.
dc.format.extent	140 с.
dc.identifier.citation	Коберник, А. О. Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей : дипломна робота ... бакалавра : 124 Системний аналіз / Коберник Андрій Олександрович. – Київ, 2024. – 140 с.
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/69042
dc.language.iso	uk
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.subject	великі мовні моделі
dc.subject	ембедінг моделі
dc.subject	система пошуку
dc.subject	векторна база даних
dc.subject	large language models
dc.subject	embedding models
dc.subject	search system
dc.subject	vector database
dc.title	Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей
dc.type	Bachelor Thesis

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Kobernyk_bakalavr.pdf
Розмір:: 4.98 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (ММСА)
Бакалаврські роботи