Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента

Вантажиться...
Ескіз

Дата

2020

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Структура i обсяг роботи: магістерська дисертація викладена на 87 сторінках, складається зі вступу, 4 розділів та висновку. Містить 27 рисунків, 1 таблицю, 7 формул, список використаних джерел із 10 найменувань. Актуальність роботи. Автоматизація процесів досягла досить високого рівня, проте залишилися задачі, які не можна описати алгоритмічно, тому, що рішення для них не знайдено, або ж занадто складне для опису. Для таких типів задач краще підходить машинне навчання з підкріпленням, оскільки там агент самостійно знаходить оптимальну поведінку без конкретного алгоритму за рахунок навчання. Такі задачі лише вимагають опису бажаної цілі. Проте на даний момент такі агенти вимагають мільйони повторів для навчання, щоб розв’язати якусь примітивну задачу, яку людина може виконати практично одразу. Різницею виступає досвід людини протягом мільйонів років еволюції, що дозволив побудувати ефективні способи навчання, в першу чергу за рахунок аналізу. Якщо середовище стає занадто складним для агента, то жоден із існуючих методів не здатен забезпечити високу успішність навчання. Тому в даній магістерській дисертації планується пошук методів, які б змогли підвищити ефективність навчання для роботизованих агентів. Дані дослідження внесуть позитивний вклад у сферу штучного інтелекту, тому є доволі актуальними. Мета роботи: підвищення швидкості та якості машинного навчання з підкріпленням для роботизованого агента. Завдання досліджень: 1. Проаналізувати сучасні методи машинного навчання з підкріпленням та існуючі середовища для тестування. 2. Розробити метод, який покращить швидкість та якість навчання 3. Реалізувати розроблений метод та створити віртуальне середовище для роботизованого агента. 4. Провести порівняльний аналіз розробленого методу із існуючими Об’єкт дослідження: процес машинного навчання з підкріпленням. Предмет дослідження: методи навчання нейронних мереж для навчання підкріпленням, ефективність навчання з підкріпленням, віртуальне середовище для роботизованого агента. Методи дослідження: методи статистичного опрацювання даних, теорія штучних нейронних мереж, теорія навчання з підкріпленням. Публікації: Фінчук О.В. СПОСІБ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ НАВЧАННЯ З ПІДКРІПЛЕННЯМ РОБОТИЗОВАНОГО АГЕНТА ЗА РАХУНОК ДЕКОМПОЗИЦІЇ ЗАДАЧІ. Інтеграція науки та практики як механізм ефективного розвитку: матеріали ІІ міжнарод. наук.-практ. конф. (м. Київ, 24-25 квітня. 2020 р.). Київ, 2020. С.185-191. Фінчук О.В. WEB MINING НА ОСНОВІ ЛЯМБДА АРХІТЕКТУРИ Rs Global, World science: випуск №7(35) том 2(м. Варшава, 12 липня 2018 р.) Варшава, 2018. С.4-8.

Опис

Ключові слова

штучні нейронні мережі, машинне навчання з підкріпленням, самонавчання, віртуальне середовище, OpenAI, роботизований агент, неперервне управління, artificial neural networks, reinforcement learning, self-learning, virtual environment, robotic agenе, continuous control

Бібліографічний опис

Фінчук, О. В. Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента : магістерська дис. : 121 Інженерія програмного забезпечення / Фінчук Олександр Васильович. – Київ, 2020. – 87 с.

ORCID

DOI