Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента

dc.contributor.advisorСтіренко, Сергій Григорович
dc.contributor.authorФінчук, Олександр Васильович
dc.date.accessioned2020-06-09T11:45:46Z
dc.date.available2020-06-09T11:45:46Z
dc.date.issued2020
dc.description.abstractenStructure and scope of master's thesis: master's thesis is presented on 87 pages, consists of introduction, 4 sections and conclusion. It contains 27 figures, 1 table, 7 formulas and a bibliography of 10 titles. Relevance of work. Automatization of daily processes showed great results, but still some tasks can’t be described with algorithms. Reason for that could be complexity of describing each possible corner case or simply solution hasn’t already discovered. For these types of tasks reinforcement learning will be more suitable, because agent finds optimal solution by itself without any specific algorithm. It achieves it by interacting with an environment. We only need to describe desired goal, which agent need to achieve. However nowadays such agents require millions of repeats of similar episodes to resolve simple task, which human can solve almost immediately. Explanation for this could be that human mind were created by millions of years of evolution. That allowed to find efficient ways of learning, first of all analysis. If an environment become too complicated for an agent, then none of existing methods can’t resolve this quite efficiently. That’s why in this master’s thesis are planned to find a more efficient way of reinforcement learning for robotic agents. The research should make a positive contribution in artificial intelligence domain so it is quite relevant. Purpose of work: increase velocity and success rate of reinforcement learning for a robotic agent. Research tasks: 1. Analyze modern methods of reinforcement learning and existing virtual environments. 2. Develop a method to improve velocity and success rate of reinforcement learning. 3. Implement designed method and create virtual environment for a robotic agent. 4. Perform testing and analyze results. Compare results with existing solutions. Object of research: process of reinforcement learning. Subject of research: reinforcement learning methods, reinforcement learning performance, virtual environments for a robotic agent. Research methods: methods of statistical data processing, theory of artificial neural networks, theory of reinforcement learning. Publications: Finchuk O. METHOD TO IMPROVE REINFORCEMENT LEARNING PERFORMANCE FOR A ROBOTIC AGENT USING DECOMPOSITION OF A TASK. Integration of science and practice as a mechanism of efficient development: materials of ІІ international science and practice conference (Kyiv April 24-25, 2020). Kyiv, 2020. P.185-191. Finchuk O. WEB MINING BASED ON LAMBDA ARCHITECTURE Rs Global, World science: publishing №7(35) vol. 2(Warsaw, July 12 2018) Warsaw, 2018. P.4-8.uk
dc.description.abstractukСтруктура i обсяг роботи: магістерська дисертація викладена на 87 сторінках, складається зі вступу, 4 розділів та висновку. Містить 27 рисунків, 1 таблицю, 7 формул, список використаних джерел із 10 найменувань. Актуальність роботи. Автоматизація процесів досягла досить високого рівня, проте залишилися задачі, які не можна описати алгоритмічно, тому, що рішення для них не знайдено, або ж занадто складне для опису. Для таких типів задач краще підходить машинне навчання з підкріпленням, оскільки там агент самостійно знаходить оптимальну поведінку без конкретного алгоритму за рахунок навчання. Такі задачі лише вимагають опису бажаної цілі. Проте на даний момент такі агенти вимагають мільйони повторів для навчання, щоб розв’язати якусь примітивну задачу, яку людина може виконати практично одразу. Різницею виступає досвід людини протягом мільйонів років еволюції, що дозволив побудувати ефективні способи навчання, в першу чергу за рахунок аналізу. Якщо середовище стає занадто складним для агента, то жоден із існуючих методів не здатен забезпечити високу успішність навчання. Тому в даній магістерській дисертації планується пошук методів, які б змогли підвищити ефективність навчання для роботизованих агентів. Дані дослідження внесуть позитивний вклад у сферу штучного інтелекту, тому є доволі актуальними. Мета роботи: підвищення швидкості та якості машинного навчання з підкріпленням для роботизованого агента. Завдання досліджень: 1. Проаналізувати сучасні методи машинного навчання з підкріпленням та існуючі середовища для тестування. 2. Розробити метод, який покращить швидкість та якість навчання 3. Реалізувати розроблений метод та створити віртуальне середовище для роботизованого агента. 4. Провести порівняльний аналіз розробленого методу із існуючими Об’єкт дослідження: процес машинного навчання з підкріпленням. Предмет дослідження: методи навчання нейронних мереж для навчання підкріпленням, ефективність навчання з підкріпленням, віртуальне середовище для роботизованого агента. Методи дослідження: методи статистичного опрацювання даних, теорія штучних нейронних мереж, теорія навчання з підкріпленням. Публікації: Фінчук О.В. СПОСІБ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ НАВЧАННЯ З ПІДКРІПЛЕННЯМ РОБОТИЗОВАНОГО АГЕНТА ЗА РАХУНОК ДЕКОМПОЗИЦІЇ ЗАДАЧІ. Інтеграція науки та практики як механізм ефективного розвитку: матеріали ІІ міжнарод. наук.-практ. конф. (м. Київ, 24-25 квітня. 2020 р.). Київ, 2020. С.185-191. Фінчук О.В. WEB MINING НА ОСНОВІ ЛЯМБДА АРХІТЕКТУРИ Rs Global, World science: випуск №7(35) том 2(м. Варшава, 12 липня 2018 р.) Варшава, 2018. С.4-8.uk
dc.format.page87 с.uk
dc.identifier.citationФінчук, О. В. Метод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агента : магістерська дис. : 121 Інженерія програмного забезпечення / Фінчук Олександр Васильович. – Київ, 2020. – 87 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/34055
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectштучні нейронні мережіuk
dc.subjectмашинне навчання з підкріпленнямuk
dc.subjectсамонавчанняuk
dc.subjectвіртуальне середовищеuk
dc.subjectOpenAIuk
dc.subjectроботизований агентuk
dc.subjectнеперервне управлінняuk
dc.subjectartificial neural networksuk
dc.subjectreinforcement learninguk
dc.subjectself-learninguk
dc.subjectvirtual environmentuk
dc.subjectrobotic agenеuk
dc.subjectcontinuous controluk
dc.subject.udc004.85uk
dc.titleМетод пiдвищення ефективностi навчання з пiдкрiпленням для роботизованого агентаuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Finchuk_magistr.pdf
Розмір:
2.12 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: