Навчання з підкріпленням для довгострокового планування

Вантажиться...
Ескіз

Дата

2020

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 91 с., 25 рис., 25 табл., 1 додаток, 44 джерел. Об’єкт дослідження - задача довгострокового планування із використанням методів глибокого навчання з підкріпленням. Предмет дослідження - методи підвищення ефективності методів глибокого навчання з підкріпленням для задач з довгостроковим плануванням. Методами досліджень виступають методи статистичного аналізу та аналізу методів навчання з підкріпленням. Мета даної роботи полягає у дослідженні та вдосконаленні існуючих методів навчання з підкріпленням для вирішення проблем із довгостроковим плануванням. Актуальність теми: останні найбільші успіхи штучного інтелекту показують, що все складнішим стає використання існуючих методів глибокого навчання з підкріпленням для дедалі складніших задач. Однією з проблем є проблема довгострокового планування. Вона виникає, коли для успішного рішення задачі потребується ієрархія навичок та планування на декількох рівнях абстракції. Таким чином, вирішення цієї проблеми, суттєво розширить діапазон можливостей навчання з підкріпленням. Результати роботи: запропонована модифікація методу моделей з темпоральними різницями для автоматичної торгівлі цінними паперами. Спроектовано та реалізовано програмний комплекс для експериментування та аналізу результатів. Новизна роботи: запропоновано модифікацію методу моделей за темпоральними різницями для автоматичної торгівлі цінними паперами.

Опис

Ключові слова

задача довгострокового планування, навчання з підкріпленням, глибоке навчання, прогнозування, цінні папери, марковські процеси прийняття рішень, ціле-залежні стратегії, long-term planning, reinforcement learning, deep learning, forecasting, stock trading, markov decision processes, goal-conditioned policies

Бібліографічний опис

Титаренко, А. М. Навчання з підкріпленням для довгострокового планування : магістерська дис. : 124 Системний аналіз / Титаренко Андрій Миколайович. – Київ, 2020. – 91 с.

ORCID

DOI