Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента

Фінчук, Олександр Васильович

Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента

dc.contributor.advisor	Стіренко, Сергій Григорович
dc.contributor.author	Фінчук, Олександр Васильович
dc.date.accessioned	2020-06-09T11:45:46Z
dc.date.available	2020-06-09T11:45:46Z
dc.date.issued	2020
dc.description.abstracten	Structure and scope of master's thesis: master's thesis is presented on 87 pages, consists of introduction, 4 sections and conclusion. It contains 27 figures, 1 table, 7 formulas and a bibliography of 10 titles. Relevance of work. Automatization of daily processes showed great results, but still some tasks can’t be described with algorithms. Reason for that could be complexity of describing each possible corner case or simply solution hasn’t already discovered. For these types of tasks reinforcement learning will be more suitable, because agent finds optimal solution by itself without any specific algorithm. It achieves it by interacting with an environment. We only need to describe desired goal, which agent need to achieve. However nowadays such agents require millions of repeats of similar episodes to resolve simple task, which human can solve almost immediately. Explanation for this could be that human mind were created by millions of years of evolution. That allowed to find efficient ways of learning, first of all analysis. If an environment become too complicated for an agent, then none of existing methods can’t resolve this quite efficiently. That’s why in this master’s thesis are planned to find a more efficient way of reinforcement learning for robotic agents. The research should make a positive contribution in artificial intelligence domain so it is quite relevant. Purpose of work: increase velocity and success rate of reinforcement learning for a robotic agent. Research tasks: 1. Analyze modern methods of reinforcement learning and existing virtual environments. 2. Develop a method to improve velocity and success rate of reinforcement learning. 3. Implement designed method and create virtual environment for a robotic agent. 4. Perform testing and analyze results. Compare results with existing solutions. Object of research: process of reinforcement learning. Subject of research: reinforcement learning methods, reinforcement learning performance, virtual environments for a robotic agent. Research methods: methods of statistical data processing, theory of artificial neural networks, theory of reinforcement learning. Publications: Finchuk O. METHOD TO IMPROVE REINFORCEMENT LEARNING PERFORMANCE FOR A ROBOTIC AGENT USING DECOMPOSITION OF A TASK. Integration of science and practice as a mechanism of efficient development: materials of ІІ international science and practice conference (Kyiv April 24-25, 2020). Kyiv, 2020. P.185-191. Finchuk O. WEB MINING BASED ON LAMBDA ARCHITECTURE Rs Global, World science: publishing №7(35) vol. 2(Warsaw, July 12 2018) Warsaw, 2018. P.4-8.	uk
dc.description.abstractuk	Структура i обсяг роботи: магістерська дисертація викладена на 87 сторінках, складається зі вступу, 4 розділів та висновку. Містить 27 рисунків, 1 таблицю, 7 формул, список використаних джерел із 10 найменувань. Актуальність роботи. Автоматизація процесів досягла досить високого рівня, проте залишилися задачі, які не можна описати алгоритмічно, тому, що рішення для них не знайдено, або ж занадто складне для опису. Для таких типів задач краще підходить машинне навчання з підкріпленням, оскільки там агент самостійно знаходить оптимальну поведінку без конкретного алгоритму за рахунок навчання. Такі задачі лише вимагають опису бажаної цілі. Проте на даний момент такі агенти вимагають мільйони повторів для навчання, щоб розв’язати якусь примітивну задачу, яку людина може виконати практично одразу. Різницею виступає досвід людини протягом мільйонів років еволюції, що дозволив побудувати ефективні способи навчання, в першу чергу за рахунок аналізу. Якщо середовище стає занадто складним для агента, то жоден із існуючих методів не здатен забезпечити високу успішність навчання. Тому в даній магістерській дисертації планується пошук методів, які б змогли підвищити ефективність навчання для роботизованих агентів. Дані дослідження внесуть позитивний вклад у сферу штучного інтелекту, тому є доволі актуальними. Мета роботи: підвищення швидкості та якості машинного навчання з підкріпленням для роботизованого агента. Завдання досліджень: 1. Проаналізувати сучасні методи машинного навчання з підкріпленням та існуючі середовища для тестування. 2. Розробити метод, який покращить швидкість та якість навчання 3. Реалізувати розроблений метод та створити віртуальне середовище для роботизованого агента. 4. Провести порівняльний аналіз розробленого методу із існуючими Об’єкт дослідження: процес машинного навчання з підкріпленням. Предмет дослідження: методи навчання нейронних мереж для навчання підкріпленням, ефективність навчання з підкріпленням, віртуальне середовище для роботизованого агента. Методи дослідження: методи статистичного опрацювання даних, теорія штучних нейронних мереж, теорія навчання з підкріпленням. Публікації: Фінчук О.В. СПОСІБ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ НАВЧАННЯ З ПІДКРІПЛЕННЯМ РОБОТИЗОВАНОГО АГЕНТА ЗА РАХУНОК ДЕКОМПОЗИЦІЇ ЗАДАЧІ. Інтеграція науки та практики як механізм ефективного розвитку: матеріали ІІ міжнарод. наук.-практ. конф. (м. Київ, 24-25 квітня. 2020 р.). Київ, 2020. С.185-191. Фінчук О.В. WEB MINING НА ОСНОВІ ЛЯМБДА АРХІТЕКТУРИ Rs Global, World science: випуск №7(35) том 2(м. Варшава, 12 липня 2018 р.) Варшава, 2018. С.4-8.	uk
dc.format.page	87 с.	uk
dc.identifier.citation	Фінчук, О. В. Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента : магістерська дис. : 121 Інженерія програмного забезпечення / Фінчук Олександр Васильович. – Київ, 2020. – 87 с.	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/34055
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.subject	штучні нейронні мережі	uk
dc.subject	машинне навчання з підкріпленням	uk
dc.subject	самонавчання	uk
dc.subject	віртуальне середовище	uk
dc.subject	OpenAI	uk
dc.subject	роботизований агент	uk
dc.subject	неперервне управління	uk
dc.subject	artificial neural networks	uk
dc.subject	reinforcement learning	uk
dc.subject	self-learning	uk
dc.subject	virtual environment	uk
dc.subject	robotic agenе	uk
dc.subject	continuous control	uk
dc.subject.udc	004.85	uk
dc.title	Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента	uk
dc.type	Master Thesis	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Finchuk_magistr.pdf
Розмір:: 2.12 MB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.06 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Магістерські роботи (ОТ)
Магістерські роботи