Комп'ютерна система управління промисловим роботом
dc.contributor.advisor | Терейковський, Ігор Анатолійович | |
dc.contributor.author | Ковальов, Костянтин Миколайович | |
dc.date.accessioned | 2019-07-26T14:45:24Z | |
dc.date.available | 2019-07-26T14:45:24Z | |
dc.date.issued | 2019-06 | |
dc.description.abstracten | Qualifying work includes an explanatory note (56 p., 2 appendix). The object of the study are reinforcement learning algorithms for the task of an industrial robotic arm control. Continuous control of an industrial robotic arm for non-trivial tasks is too complicated or even unsolvable for classical methods of robotics. Reinforcement learning methods can be used in this case. They are quite simple to implement, allow for generalization to unseen cases, and learn from high-dimensional data. We implement deep deterministic policy gradient algorithm that is suitable for complex continuous contol tasks. During the study: • An analysis of existing classical methods for the problem of industrial robot control was conducted • An analysis of existing algorithms of training with reinforcement learning and their use in the field of robotics has been conducted • Deep deterministic policy gradient algorithm is implemented • Implemented algorithm is tested on a simplified environment • The architecture of the neural network is proposed for solving the problem • Algorithm was tested on the training set of objects • Algorithm was tested for its generalization ability on the test set It was shown that deep deterministic policy gradient algorithm with neural network as policy approximator is able to solve the problem with the image as an input and to generalize to objects not seen before. | uk |
dc.description.abstractuk | Кваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка). Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою. Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління. В ході дослідження: проведено аналіз існуючих класичних методів для задачі управління промисловим роботом проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки реалізовано алгоритм градієнту глибокої детермінованої стратегії проведено тестування реалізованого алгоритму у спрощеному середовищі запропоновано архітектуру нейронної мережі для вирішення поставленої задачі проведено тестування алгоритму на навчальній виборці проведено тестування алгоритму на здатність до узагальнення на тестовій виборці Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти. | uk |
dc.format.page | 64 с. | uk |
dc.identifier.citation | Ковальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/28610 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | робототехніка | uk |
dc.subject | градієнт стратегії | uk |
dc.subject | марковський процес вирішування | uk |
dc.subject | нейронна мережа | uk |
dc.subject | reinforcement learning | uk |
dc.subject | robotics | uk |
dc.subject | policy gradients | uk |
dc.subject | Markov decision process | uk |
dc.subject | neural network | uk |
dc.title | Комп'ютерна система управління промисловим роботом | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kovaliov_bakalavr.pdf
- Розмір:
- 1.06 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.86 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: