Комп'ютерна система управління промисловим роботом

dc.contributor.advisorТерейковський, Ігор Анатолійович
dc.contributor.authorКовальов, Костянтин Миколайович
dc.date.accessioned2019-07-26T14:45:24Z
dc.date.available2019-07-26T14:45:24Z
dc.date.issued2019-06
dc.description.abstractenQualifying work includes an explanatory note (56 p., 2 appendix). The object of the study are reinforcement learning algorithms for the task of an industrial robotic arm control. Continuous control of an industrial robotic arm for non-trivial tasks is too complicated or even unsolvable for classical methods of robotics. Reinforcement learning methods can be used in this case. They are quite simple to implement, allow for generalization to unseen cases, and learn from high-dimensional data. We implement deep deterministic policy gradient algorithm that is suitable for complex continuous contol tasks. During the study: • An analysis of existing classical methods for the problem of industrial robot control was conducted • An analysis of existing algorithms of training with reinforcement learning and their use in the field of robotics has been conducted • Deep deterministic policy gradient algorithm is implemented • Implemented algorithm is tested on a simplified environment • The architecture of the neural network is proposed for solving the problem • Algorithm was tested on the training set of objects • Algorithm was tested for its generalization ability on the test set It was shown that deep deterministic policy gradient algorithm with neural network as policy approximator is able to solve the problem with the image as an input and to generalize to objects not seen before.uk
dc.description.abstractukКваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка). Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою. Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління. В ході дослідження:  проведено аналіз існуючих класичних методів для задачі управління промисловим роботом  проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки  реалізовано алгоритм градієнту глибокої детермінованої стратегії  проведено тестування реалізованого алгоритму у спрощеному середовищі  запропоновано архітектуру нейронної мережі для вирішення поставленої задачі  проведено тестування алгоритму на навчальній виборці  проведено тестування алгоритму на здатність до узагальнення на тестовій виборці Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти.uk
dc.format.page64 с.uk
dc.identifier.citationКовальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/28610
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectнавчання з підкріпленнямuk
dc.subjectробототехнікаuk
dc.subjectградієнт стратегіїuk
dc.subjectмарковський процес вирішуванняuk
dc.subjectнейронна мережаuk
dc.subjectreinforcement learninguk
dc.subjectroboticsuk
dc.subjectpolicy gradientsuk
dc.subjectMarkov decision processuk
dc.subjectneural networkuk
dc.titleКомп'ютерна система управління промисловим роботомuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Kovaliov_bakalavr.pdf
Розмір:
1.06 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.86 KB
Формат:
Item-specific license agreed upon to submission
Опис: