Комп'ютерна система управління промисловим роботом

Ковальов, Костянтин Миколайович

Комп'ютерна система управління промисловим роботом

dc.contributor.advisor	Терейковський, Ігор Анатолійович
dc.contributor.author	Ковальов, Костянтин Миколайович
dc.date.accessioned	2019-07-26T14:45:24Z
dc.date.available	2019-07-26T14:45:24Z
dc.date.issued	2019-06
dc.description.abstract	Кваліфікаційна робота включає пояснювальну записку (56 с., 2 додатка). Об’єкт дослідження – алгоритми навчання з підкріпленням для задачі керування промисловою роботичною рукою. Задача непервного керування промисловою роботичною рукою для нетривіальних задач є занадто складною або навіть невирішуваною для класичних методів робототехніки. Методи навчання з підкріпленням можуть бути використані в цьому випадку. Вони є досить простими у реалізації, дозволяють узагальнюватися на небачені випадки, та вчитися на даних великої розмірності. Ми реалізуємо метод градієнту глибокої детермінованої стратегії, який підходить для складних задач непервного управління. В ході дослідження:  проведено аналіз існуючих класичних методів для задачі управління промисловим роботом  проведено аналіз існуючих алгоритмів навчання з підкріпленням та їх використання в області робототехніки  реалізовано алгоритм градієнту глибокої детермінованої стратегії  проведено тестування реалізованого алгоритму у спрощеному середовищі  запропоновано архітектуру нейронної мережі для вирішення поставленої задачі  проведено тестування алгоритму на навчальній виборці  проведено тестування алгоритму на здатність до узагальнення на тестовій виборці Показано здатність алгоритму градієнту глибокої детермінованої стратегії з використанням нейронних мереж для представлення стратегії вирішувати поставлену задачі з зображенням в якості входу та узагальнюватися на небачені до цього об’єкти.	uk
dc.description.abstracten	Qualifying work includes an explanatory note (56 p., 2 appendix). The object of the study are reinforcement learning algorithms for the task of an industrial robotic arm control. Continuous control of an industrial robotic arm for non-trivial tasks is too complicated or even unsolvable for classical methods of robotics. Reinforcement learning methods can be used in this case. They are quite simple to implement, allow for generalization to unseen cases, and learn from high-dimensional data. We implement deep deterministic policy gradient algorithm that is suitable for complex continuous contol tasks. During the study: • An analysis of existing classical methods for the problem of industrial robot control was conducted • An analysis of existing algorithms of training with reinforcement learning and their use in the field of robotics has been conducted • Deep deterministic policy gradient algorithm is implemented • Implemented algorithm is tested on a simplified environment • The architecture of the neural network is proposed for solving the problem • Algorithm was tested on the training set of objects • Algorithm was tested for its generalization ability on the test set It was shown that deep deterministic policy gradient algorithm with neural network as policy approximator is able to solve the problem with the image as an input and to generalize to objects not seen before.	uk
dc.format.page	64 с.	uk
dc.identifier.citation	Ковальов, К. М. Комп'ютерна система управління промисловим роботом : дипломний проект ... бакалавра : 6.050102 Комп'ютерна інженерія / Ковальов Костянтин Миколайович. – Київ, 2019. – 64 с.	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/28610
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.subject	навчання з підкріпленням	uk
dc.subject	робототехніка	uk
dc.subject	градієнт стратегії	uk
dc.subject	марковський процес вирішування	uk
dc.subject	нейронна мережа	uk
dc.subject	reinforcement learning	uk
dc.subject	robotics	uk
dc.subject	policy gradients	uk
dc.subject	Markov decision process	uk
dc.subject	neural network	uk
dc.title	Комп'ютерна система управління промисловим роботом	uk
dc.type	Bachelor Thesis	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Kovaliov_bakalavr.pdf
Розмір:: 1.06 MB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 1.86 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (СПСКС)
Бакалаврські роботи