Комп'ютерна система управління промисловим роботом
Вантажиться...
Дата
2019-06
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Кваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка).
Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою.
Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління.
В ході дослідження:
проведено аналіз існуючих класичних методів для задачі управління промисловим роботом
проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки
реалізовано алгоритм градієнту глибокої детермінованої стратегії
проведено тестування реалізованого алгоритму у спрощеному середовищі
запропоновано архітектуру нейронної мережі для вирішення поставленої задачі
проведено тестування алгоритму на навчальній виборці
проведено тестування алгоритму на здатність до узагальнення на тестовій виборці
Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти.
Опис
Ключові слова
навчання з підкріпленням, робототехніка, градієнт стратегії, марковський процес вирішування, нейронна мережа, reinforcement learning, robotics, policy gradients, Markov decision process, neural network
Бібліографічний опис
Ковальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с.