Крос-модальні представлення налаштовані на MusicCaps для пошуку музики за текстовим описом

Вантажиться...
Ескіз

Дата

2023

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Пояснювальна записка дипломної роботи за обсягом становить 42 сторінки, містить 12 таблиці та 8 рисунків. Для дослідження було використано 11 бібліографічних найменувань. Музика є важливою складовою нашого життя. І з кожним днем її кількість тільки збільшується. Тому проблема пошуку музики є дуже актуальною. Текстовий опис є одним з основних способів, за допомогою якого люди виражають свої музичні вподобання або шукають певні типи пісень. Наприклад, користувачі можуть використовувати слова, які описують настрій (веселий, сумний, енергійний), жанр (рок, поп, електронна музика) або характеристики звучання (акустичний, експериментальний, ритмічний) для пошуку музики, яка відповідає їхнім потребам. В даній роботі для вирішення цієї задачі використовується моделі машинного навчання для створення крос-модальних представлень. Дана модель створює такі векторні представлення музики та тексту, що знаходяться близько один до одного, якщо текст описує музику. За допомогою цього з бібліотеки музики можна вибрати ті треки які найбільше підходять під текстовий опис. Основний внесок цієї дипломної роботи полягає в використані унікального датасетсу в межах задачі пошуку музики за текстовим описом. Також в цій роботі були запропоновані нові модифікації існуючих моделей.

Опис

Ключові слова

машинне навчання, machine learning, крос-модальні представлення, cross-modal embeddings, MusicCaps, MusicCaps, трансформери, transformers, пошук музики за текстовим описом, text-to-music retrieval

Бібліографічний опис

Плахтій, Г. О. Крос-модальні представлення налаштовані на MusicCaps для пошуку музики за текстовим описом : дипломна робота … бакалавра : 113 Прикладна математика / Плахтій Гліб Олексійович – Київ, 2023. – 42 с.

DOI