Методи генерації мультимедійного контенту на основі штучного інтелекту

Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. Розвиток генеративних моделей штучного інтелекту зумовив появу нових можливостей для автоматизованого створення мультимедійного контенту, включаючи текст, зображення, аудіо, музику та відео. Інтеграція таких моделей у єдине веб-середовище потребує дослідження сучасних підходів до мультимодальної генерації, порівняння спеціалізованих та мультимодальний моделей, а також розроблення інструментів, які забезпечують користувачеві повний цикл медіавиробництва. Тому виконане дослідження та розроблення веб-системи генерації й редагування мультимедійного контенту є актуальними та мають як теоретичне, так і практичне значення. Метою роботи є аналіз сучасних спеціалізованих та мультимодальних моделей генерації медіа в контекстах порівняння ефективності, інтеграції в існуючі робочі процеси, та комерціалізації. Завдання дослідження: 1) провести аналіз сучасних моделей генерації мультимедійного контенту та порівняти мультимодальні й спеціалізовані підходи; 2) визначити вимоги щодо створення системи генерації та редагування контенту з допомогою ШІ; 3) обґрунтувати вибір технологій, моделей та інструментів для розроблення зазначеної системи; 4) реалізувати систему на основі обраних технологій з підтримкою текстової, мовної, музичної, графічної та відеогенерації; 5) провести тестування роботи системи; 6) створити концепцію стартап проєкту, що розкриває маркетингові аспекти впровадження системи, включаючи аналіз ринку, визначення цільової аудиторії та стратегію просування; Об’єкт дослідження – процеси та технології генерації мультимедійного контенту за допомогою штучного інтелекту. Предмет дослідження – методи, алгоритми і програмні засоби мультимодальної генерації та редагування мультимедійного контенту на основі сучасних нейронних моделей. Практична цінність отриманих результатів полягає у створенні програмної системи, що забезпечує автоматизовану генерацію мультимедійних матеріалів та об’єднує в єдиному середовищі текстові, візуальні, аудіо- та відеомоделі. Розроблена система дозволяє формувати повноцінний відеоконтент, експортувати та імпортувати проєкти, а також керувати параметрами стилю, структури та мультимедійної композиції. Запропонована концепція стартап проєкту підтверджує перспективність впровадження системи у сфери медіавиробництва, креативних індустрій, маркетингу та освітніх технологій. Апробація результатів дисертації. Основні положення даної роботи доповідались та обговорювались на: – II-й Міжнародній науково-практичній конференції “Scientific Progress: Theories, Applications and Global Impact”, 27-29 жовтня, 2025 м. Браґа, Португалія. Дисертація складається з вступу, чотирьох розділів та висновків. Повний обсяг дисертації становить _93_ сторінок, включаючи _7_ таблиць, _10_ рисунків та _43_ найменувань у списку використаних джерел.

Опис

Ключові слова

генеративні моделі, мультимодальний штучний інтелект, MERN-stack, дифузійні моделі, мультимедійний контент, веб-система, стартап, generative models, multimodal artificial intelligence, dif usion models, multimedia content, web system, start-up

Бібліографічний опис

Кондрашін, О. М. Методи генерації мультимедійного контенту на основі штучного інтелекту : магістерська дис. : 122 Комп’ютерні науки / Кондрашін Олексій Максимович. – Київ, 2025. – 93 с.

ORCID

DOI