Reducing risk for assistive reinforcement learning policies with diffusion models

dc.contributor.authorTytarenko, Andrii
dc.date.accessioned2025-02-10T13:22:10Z
dc.date.available2025-02-10T13:22:10Z
dc.date.issued2024
dc.description.abstractCare-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, techno-logical progress can democratize these solutions. Safety remains a paramount con-cern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments.
dc.description.abstractotherДоглядова та допоміжна робототехніка, що ґрунтується на прогресі ШІ, пропонує багатообіцяючі рішення для задоволення зростаючого попиту на догляд, особливо в контексті збільшення кількості людей, які потребують допомоги. Це створює нагальну потребу в ефективних і безпечних допоміжних пристроях, особливо в світлі підвищеного попиту через травми, пов’язані з війною. Хоча вартість була перешкодою для доступності, технологічний прогрес може демократизувати ці рішення. Безпека залишається головною проблемою, особливо з огляду на складну взаємодію між допоміжними роботами та людьми. У цьому дослідженні досліджується застосування навчання з підкріпленням (RL) та імітаційного навчання для вдосконалення розробки політики для допоміжних роботів. Запропонований підхід робить ризиковані політики безпечнішими без додаткових взаємодій з навколишнім середовищем. Удосконалення звичайних підходів RL у завданнях, пов’язаних із допоміжною робототехнікою, демонструється шляхом експериментів із використанням імітованих середовищ.
dc.format.pagerangeС. 148-154
dc.identifier.citationTytarenko, A. Reducing risk for assistive reinforcement learning policies with diffusion models / A. Tytarenko // Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал. – 2024. – № 3. – С. 148-154 . – Бібліогр.: 12 назв.
dc.identifier.doihttps://doi.org/10.20535/SRIT.2308-8893.2024.3.09
dc.identifier.orcid0000-0002-8265-642X
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/72412
dc.language.isoen
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.relation.ispartofСистемні дослідження та інформаційні технології : міжнародний науково-технічний журнал, 2024, № 3
dc.subjectassistive robotics
dc.subjectreinforcement learning
dc.subjectdiffusion models
dc.subjectimitation learning
dc.subjectдопоміжна робототехніка
dc.subjectнавчання з підкріпленням
dc.subjectдифузійні моделі
dc.subjectімітаційне навчання
dc.subject.udc004.852
dc.titleReducing risk for assistive reinforcement learning policies with diffusion models
dc.title.alternativeЗниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
315284-730152-1-10-20241116.pdf
Розмір:
251.25 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: