Крос-модальні представлення налаштовані на MusicCaps для пошуку музики за текстовим описом

dc.contributor.advisorЯворський, Олександр Андрійович
dc.contributor.authorПлахтій, Гліб Олексійович
dc.date.accessioned2023-09-25T08:22:42Z
dc.date.available2023-09-25T08:22:42Z
dc.date.issued2023
dc.description.abstractПояснювальна записка дипломної роботи за обсягом становить 42 сторінки, містить 12 таблиці та 8 рисунків. Для дослідження було використано 11 бібліографічних найменувань. Музика є важливою складовою нашого життя. І з кожним днем її кількість тільки збільшується. Тому проблема пошуку музики є дуже актуальною. Текстовий опис є одним з основних способів, за допомогою якого люди виражають свої музичні вподобання або шукають певні типи пісень. Наприклад, користувачі можуть використовувати слова, які описують настрій (веселий, сумний, енергійний), жанр (рок, поп, електронна музика) або характеристики звучання (акустичний, експериментальний, ритмічний) для пошуку музики, яка відповідає їхнім потребам. В даній роботі для вирішення цієї задачі використовується моделі машинного навчання для створення крос-модальних представлень. Дана модель створює такі векторні представлення музики та тексту, що знаходяться близько один до одного, якщо текст описує музику. За допомогою цього з бібліотеки музики можна вибрати ті треки які найбільше підходять під текстовий опис. Основний внесок цієї дипломної роботи полягає в використані унікального датасетсу в межах задачі пошуку музики за текстовим описом. Також в цій роботі були запропоновані нові модифікації існуючих моделей.uk
dc.description.abstractotherThe diploma work explanatory note includes 42 pages of the text, 12 tables and 8 illustrations. At the problem modern state analysis, overall 11 references were used. Music is an important part of our life. And every day its number only increases. Therefore, the problem of music retrieval is very relevant. Text description is one of the main ways people express their music preferences or search for specific types of songs. For example, users can use words that describe mood (happy, sad, energetic), genre (rock, pop, electronic music), or sound characteristics (acoustic, experimental, rhythmic) to find music that fits their needs. This work uses machine learning models to create cross-modal embeddings to solve this problem. This model creates vector embeddings of music and text such that the embeddings of music and text are close to each other if the text describes the music. With this, you can select from the music library those tracks that are most suitable for the text description. The main contribution of this thesis is the use of a unique dataset for model training. New ones were also proposed in this work modifications of existing models.uk
dc.format.extent42 с.uk
dc.identifier.citationПлахтій, Г. О. Крос-модальні представлення налаштовані на MusicCaps для пошуку музики за текстовим описом : дипломна робота … бакалавра : 113 Прикладна математика / Плахтій Гліб Олексійович – Київ, 2023. – 42 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/60521
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectmachine learninguk
dc.subjectкрос-модальні представленняuk
dc.subjectcross-modal embeddingsuk
dc.subjectMusicCapsuk
dc.subjectMusicCapsuk
dc.subjectтрансформериuk
dc.subjecttransformersuk
dc.subjectпошук музики за текстовим описомuk
dc.subjecttext-to-music retrievaluk
dc.titleКрос-модальні представлення налаштовані на MusicCaps для пошуку музики за текстовим описомuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Plakhtii_bakalavr.pdf
Розмір:
663.33 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: