Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей
dc.contributor.advisor | Недашківська, Надія Іванівна | |
dc.contributor.author | Коберник, Андрій Олександрович | |
dc.date.accessioned | 2024-09-19T08:42:27Z | |
dc.date.available | 2024-09-19T08:42:27Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Дипломна робота: 140 с., 14 табл., 21 рис., 2 додатки, 23 джерела. Об'єкт дослідження - порівняння ембедінг моделей для задачі векторизації тексту з максимальним збереженням сенсу та семантики. Аналіз точності пошуку при використанні різних моделей. Аналіз надання додаткового контексту на вхід великих мовних моделей і його вплив на якість і точність генерації кінцевого результату у задачі відповіді на питання. У сучасному світі обсяг інформації, і її доступність стрімко зростає, що ускладнює її ефективний пошук і обробку. Ефективні системи пошуку у поєднанні з моделями генерації відповідей можуть значно покращити досвід користувачів у використанні персональних асистентів та систем пошуку. Метою цієї роботи є розробка та аналіз системи, яка використовує векторний пошук для подання релевантної інформації у вхідний контекст великих мовних моделей, для отримання відповідей на основі цього контексту, проаналізувати чи покращується якість згенерованих відповідей. Система інтегрує ембедінг моделі для векторизації тексту та великі мовні моделі для генерації відповідей, що дозволяє отримати точніші і контекстуально релевантні відповіді без необхідності додаткового навчання. Ця система спрямована на покращення точності відповідей мовних моделей шляхом використання ембедінг та великих мовних моделей, векторних баз даних, що дозволяє ефективно здійснювати пошук релевантної інформації та покращує якість генерації відповідей. Такий підхід значно підвищує ефективність систем, роблячи їх роботу ефективною. Розроблено програмний продукт на мові програмування Python. | |
dc.description.abstractother | Thesis: 140 p., 14 t., 21 fig., 2 append., 23 references. Object of research - comparison of embedding models for the task of text vectorisation with maximum preservation of meaning and semantics. Analysis of search accuracy when using different models. Analysis of providing additional context to the input of large language models and its impact on the quality and accuracy of generating the final result in the task of answering a question. In today's world, the amount of information and its availability is growing rapidly, which makes it difficult to find and process it efficiently. Efficient search systems combined with answer generation models can significantly improve the user experience of personal assistants and search engines. The aim of this paper is to develop and analyse a system that uses vector search to provide relevant information in the input context of large language models, to retrieve answers based on this context, and to analyse whether the quality of the generated answers improves. The system integrates embedding models for text vectorisation and large language models for answer generation, which allows for more accurate and contextually relevant answers without the need for additional training. This system aims to improve the accuracy of language model responses by using embedding and large language models, vector databases, which allows for efficient search for relevant information and improves the quality of response generation. This approach significantly improves the efficiency of the systems, making their work effective. A software product was developed in the Python programming language. | |
dc.format.extent | 140 с. | |
dc.identifier.citation | Коберник, А. О. Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей : дипломна робота ... бакалавра : 124 Системний аналіз / Коберник Андрій Олександрович. – Київ, 2024. – 140 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/69042 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | великі мовні моделі | |
dc.subject | ембедінг моделі | |
dc.subject | система пошуку | |
dc.subject | векторна база даних | |
dc.subject | large language models | |
dc.subject | embedding models | |
dc.subject | search system | |
dc.subject | vector database | |
dc.title | Аналіз використання ембедінг моделей в задачі векторного пошуку для покращення відповідей великих мовних моделей | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kobernyk_bakalavr.pdf
- Розмір:
- 4.98 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: