Аналіз чутливості DRL-політик до стохастичних збурень середовища

dc.contributor.authorБезруков, І. О.
dc.contributor.authorПотапова, К. Р.
dc.contributor.authorБойко, Н. В.
dc.date.accessioned2026-01-27T15:27:02Z
dc.date.available2026-01-27T15:27:02Z
dc.date.issued2025
dc.description.abstractotherThis paper investigates the "Sim-to-Real Gap" in Deep Reinforcement Learning (DRL). We quantify this problem by training an agent in an idealized CartPole environment and then testing its robustness against unpredicted stochastic disturbances, which serve as an analog for real-world forces. The results demonstrate a catastrophic performance degradation in the "naive" agent, underscoring the critical need for advanced training methodologies, such as Domain Randomization, to develop robust systems.
dc.format.pagerangeС. 251-255
dc.identifier.citationБезруков, І. О. Аналіз чутливості DRL-політик до стохастичних збурень середовища / Безруков І. О., Потапова К. Р., Бойко Н. В. // Прикладна математика та комп'ютинг. ПМК, 2025 : Вісімнадцята наук. конф. магістрантів та аспірантів, [Київ], 19-21 лист. 2025 р. : зб. тез доп. / ФПМ КПІ ім. Ігоря Сікорського. - Київ, 2025. - С. 251-255.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/78452
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.relation.ispartofПрикладна математика та комп'ютинг. ПМК, 2025 : Вісімнадцята наукова конференція магістрантів та аспірантів, Київ, 19-21 листопада 2025 року : збірник тез доповідей
dc.subject.udc004.85:681.5.017
dc.titleАналіз чутливості DRL-політик до стохастичних збурень середовища
dc.title.alternativeSensitivity Analysis of DRL Policies to Environmental Stochastic Disturbances
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
PMK2025_P251-255.pdf
Розмір:
258.96 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: