Терейковський, Ігор АнатолійовичКовальов, Костянтин Миколайович2019-07-262019-07-262019-06Ковальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с.https://ela.kpi.ua/handle/123456789/28610Кваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка). Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою. Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління. В ході дослідження: проведено аналіз існуючих класичних методів для задачі управління промисловим роботом проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки реалізовано алгоритм градієнту глибокої детермінованої стратегії проведено тестування реалізованого алгоритму у спрощеному середовищі запропоновано архітектуру нейронної мережі для вирішення поставленої задачі проведено тестування алгоритму на навчальній виборці проведено тестування алгоритму на здатність до узагальнення на тестовій виборці Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти.ukнавчання з підкріпленнямробототехнікаградієнт стратегіїмарковський процес вирішуваннянейронна мережаreinforcement learningroboticspolicy gradientsMarkov decision processneural networkКомп'ютерна система управління промисловим роботомBachelor Thesis64 с.