Методи генерації мультимедійного контенту на основі штучного інтелекту
| dc.contributor.advisor | Тихоход, Володимир Олександрович | |
| dc.contributor.author | Кондрашін, Олексій Максимович | |
| dc.date.accessioned | 2026-01-29T12:17:58Z | |
| dc.date.available | 2026-01-29T12:17:58Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Актуальність теми. Розвиток генеративних моделей штучного інтелекту зумовив появу нових можливостей для автоматизованого створення мультимедійного контенту, включаючи текст, зображення, аудіо, музику та відео. Інтеграція таких моделей у єдине веб-середовище потребує дослідження сучасних підходів до мультимодальної генерації, порівняння спеціалізованих та мультимодальний моделей, а також розроблення інструментів, які забезпечують користувачеві повний цикл медіавиробництва. Тому виконане дослідження та розроблення веб-системи генерації й редагування мультимедійного контенту є актуальними та мають як теоретичне, так і практичне значення. Метою роботи є аналіз сучасних спеціалізованих та мультимодальних моделей генерації медіа в контекстах порівняння ефективності, інтеграції в існуючі робочі процеси, та комерціалізації. Завдання дослідження: 1) провести аналіз сучасних моделей генерації мультимедійного контенту та порівняти мультимодальні й спеціалізовані підходи; 2) визначити вимоги щодо створення системи генерації та редагування контенту з допомогою ШІ; 3) обґрунтувати вибір технологій, моделей та інструментів для розроблення зазначеної системи; 4) реалізувати систему на основі обраних технологій з підтримкою текстової, мовної, музичної, графічної та відеогенерації; 5) провести тестування роботи системи; 6) створити концепцію стартап проєкту, що розкриває маркетингові аспекти впровадження системи, включаючи аналіз ринку, визначення цільової аудиторії та стратегію просування; Об’єкт дослідження – процеси та технології генерації мультимедійного контенту за допомогою штучного інтелекту. Предмет дослідження – методи, алгоритми і програмні засоби мультимодальної генерації та редагування мультимедійного контенту на основі сучасних нейронних моделей. Практична цінність отриманих результатів полягає у створенні програмної системи, що забезпечує автоматизовану генерацію мультимедійних матеріалів та об’єднує в єдиному середовищі текстові, візуальні, аудіо- та відеомоделі. Розроблена система дозволяє формувати повноцінний відеоконтент, експортувати та імпортувати проєкти, а також керувати параметрами стилю, структури та мультимедійної композиції. Запропонована концепція стартап проєкту підтверджує перспективність впровадження системи у сфери медіавиробництва, креативних індустрій, маркетингу та освітніх технологій. Апробація результатів дисертації. Основні положення даної роботи доповідались та обговорювались на: – II-й Міжнародній науково-практичній конференції “Scientific Progress: Theories, Applications and Global Impact”, 27-29 жовтня, 2025 м. Браґа, Португалія. Дисертація складається з вступу, чотирьох розділів та висновків. Повний обсяг дисертації становить _93_ сторінок, включаючи _7_ таблиць, _10_ рисунків та _43_ найменувань у списку використаних джерел. | |
| dc.description.abstractother | Relevance of the topic. The development of generative artificial intelligence models has led to new opportunities for the automated creation of multimedia content, including text, images, audio, music, and video. The integration of such models into a single web environment requires research into modern approaches to multimodal generation, comparison of specialised and multimodal models, and the development of tools that provide the user with a complete media production cycle. Therefore, the research and development of a web system for generating and editing multimedia content is relevant and has both theoretical and practical significance. The aim of the work is to analyse specialised and multimodal models of media generation in the contexts of comparing effectiveness, integration into existing work processes, and commercialisation. Research objectives: 1) to analyse modern models of media content generation and compare multimodal and specialised approaches; 2) to identify requirements and formulate a task for creating a web system for content generation and editing; 3) to justify the choice of technologies, models and tools for developing a web system; 4) to implement a web system based on selected technologies with support for text, speech, music, graphics and video generation; 5) to test the system's performance; 6) to create a concept for a start-up project that reveals the marketing aspects of the system's implementation, including market analysis, target audience identification and promotion strategy; The object of research is the processes and technologies of generating multimedia content using artificial intelligence. The subject of research is methods, algorithms, and software tools for multimodal generation and editing of multimedia content based on modern neural models. The practical value of the results obtained lies in the creation of a software system that provides automated generation of multimedia materials and combines text, visual, audio and video models in a single environment. The developed system allows its users to create full-fledged video content, export and import projects, and manage style, structure, and multimedia composition parameters. The proposed concept for a start-up project confirms the promising prospects for the implementation of the system in the fields of media production, creative industries, marketing, and educational technologies. Approbation of the dissertation results. The main provisions of this work were presented and discussed at: – II International Scientific and Practical Conference ‘Scientific Progress: Theories, Applications and Global Impact’, 27-29 October, 2025, Braga, Portugal. The dissertation consists of an introduction, four chapters and conclusions. The full volume of the dissertation is _93_ pages, including _7_ tables, _10_ figures and _43_ titles in the list of references. | |
| dc.format.extent | 93 с. | |
| dc.identifier.citation | Кондрашін, О. М. Методи генерації мультимедійного контенту на основі штучного інтелекту : магістерська дис. : 122 Комп’ютерні науки / Кондрашін Олексій Максимович. – Київ, 2025. – 93 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/78516 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | генеративні моделі | |
| dc.subject | мультимодальний штучний інтелект | |
| dc.subject | MERN-stack | |
| dc.subject | дифузійні моделі | |
| dc.subject | мультимедійний контент | |
| dc.subject | веб-система | |
| dc.subject | стартап | |
| dc.subject | generative models | |
| dc.subject | multimodal artificial intelligence | |
| dc.subject | dif usion models | |
| dc.subject | multimedia content | |
| dc.subject | web system | |
| dc.subject | start-up | |
| dc.title | Методи генерації мультимедійного контенту на основі штучного інтелекту | |
| dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kondraschin_magistr.pdf
- Розмір:
- 2.78 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: