Розробка голосового інтерфейсу для створення діаграм

dc.contributor.advisorКуссуль, Наталія Миколаївна
dc.contributor.authorПоночевний, Назар Юрійович
dc.date.accessioned2023-09-25T08:09:09Z
dc.date.available2023-09-25T08:09:09Z
dc.date.issued2023-06-20
dc.description.abstractПояснювальна записка дипломної роботи за обсягом становить 63 сторінки, містить 4 таблиці та 6 рисунків. Для дослідження було використано 64 бібліографічних найменувань. Люди все частіше приймають рішення на основі аналізу даних і одним з популярних способів комунікації фактів є візуалізація даних. Проте процес створення графіків вручну є довгоємним процесом і потребує вміння візуалізації даних, тому цей процес може бути частково автоматизований за допомогою голосового інтерфейсу. До цього часу вже було проведено багато досліджень щодо створення графіків за допомогою коротких вказівок, але все ще залишаються питання щодо використання вільного голосового вводу. Ми провели розвідувальне дослідження, щоб визначити структуру голосової взаємодії, охарактеризувати висловлювання відповідно до їхніх фраз та інформації, яку вони містять, а також виявити прогалини. Крім того, ми згенерували датасет голосових описів графіків і виконали порівняльний аналіз моделей машинного навчання на основі архітектури Transformer для генерації коду графіків, щоб розробити прототип розмовного інтерфейсу користувача для створення графіків за допомогою голосового введення. Отримані результати дозволять розробляти більш ефективні голосові розмовні інтерфейси користувача та застосовувати їх у більш складних контекстах аналізу даних. Основний внесок цієї дипломної роботи полягає у формулюванні структури і генерації датасету відкритих голосових описів графіків. Це необхідно для тренування і покращення моделей машинного навчання, які генерують код графіків на основі відкритого голосового введення.uk
dc.description.abstractotherThe diploma work explanatory note includes 63 pages of the text, 4 tables and 6 illustrations. At the problem modern state analysis, overall 64 references were used. People are increasingly making decisions based on data analysis, and one of the most popular ways to communicate facts is through data visualization. However, the process of creating graphs manually is time-consuming and requires data visualization skills, so this process can be partially automated using a voice interface. So far, a lot of research has been done on creating graphs using short utterances, but there are questions remaining about the use of free-form voice input. We conducted an exploratory study to determine the structure of voice interaction, characterize utterances according to their phrases and the information they contain, and identify gaps. In addition, we generated a dataset of voice descriptions of bar charts and performed a comparative analysis of machine learning models based on the Transformer architecture for generating chart code to develop a prototype conversational user interface for creating charts using voice input. The results will allow for the development of more effective voice conversational user interfaces and their application in more complex data analysis contexts. The main contribution of this thesis is the formulation of a structure and generation of a dataset of open voice chart descriptions. This is necessary for training and improving machine learning models that generate chart code based on open voice input.uk
dc.format.extent63 с.uk
dc.identifier.citationПоночевний, Н. Ю. Розробка голосового інтерфейсу для створення діаграм : дипломна робота … бакалавра : 113 Прикладна математика / Поночевний Назар Юрійович. – Київ, 2023. – 63 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/60515
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectmachine learninguk
dc.subjectвізуалізація данихuk
dc.subjectdata visualizationuk
dc.subjectголосовий інтерфейсuk
dc.subjectvoice interfaceuk
dc.subjectтрансформериuk
dc.subjecttransformersuk
dc.subjectобробка природної мовиuk
dc.subjectnatural language processinguk
dc.titleРозробка голосового інтерфейсу для створення діаграмuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Ponochevnyi_bakalavr.pdf
Розмір:
460.96 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: