Терейковський, Ігор АнатолійовичКовальов, Костянтин Миколайович2019-07-262019-07-262019-06Ковальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с.https://ela.kpi.ua/handle/123456789/28610Кваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка). Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою. Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління. В ході дослідження:  проведено аналіз існуючих класичних методів для задачі управління промисловим роботом  проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки  реалізовано алгоритм градієнту глибокої детермінованої стратегії  проведено тестування реалізованого алгоритму у спрощеному середовищі  запропоновано архітектуру нейронної мережі для вирішення поставленої задачі  проведено тестування алгоритму на навчальній виборці  проведено тестування алгоритму на здатність до узагальнення на тестовій виборці Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти.ukнавчання з підкріпленнямробототехнікаградієнт стратегіїмарковський процес вирішуваннянейронна мережаreinforcement learningroboticspolicy gradientsMarkov decision processneural networkКомп'ютерна система управління промисловим роботомBachelor Thesis64 с.