Reducing risk for assistive reinforcement learning policies with diffusion models
dc.contributor.author | Tytarenko, Andrii | |
dc.date.accessioned | 2025-02-10T13:22:10Z | |
dc.date.available | 2025-02-10T13:22:10Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, techno-logical progress can democratize these solutions. Safety remains a paramount con-cern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments. | |
dc.description.abstractother | Доглядова та допоміжна робототехніка, що ґрунтується на прогресі ШІ, пропонує багатообіцяючі рішення для задоволення зростаючого попиту на догляд, особливо в контексті збільшення кількості людей, які потребують допомоги. Це створює нагальну потребу в ефективних і безпечних допоміжних пристроях, особливо в світлі підвищеного попиту через травми, пов’язані з війною. Хоча вартість була перешкодою для доступності, технологічний прогрес може демократизувати ці рішення. Безпека залишається головною проблемою, особливо з огляду на складну взаємодію між допоміжними роботами та людьми. У цьому дослідженні досліджується застосування навчання з підкріпленням (RL) та імітаційного навчання для вдосконалення розробки політики для допоміжних роботів. Запропонований підхід робить ризиковані політики безпечнішими без додаткових взаємодій з навколишнім середовищем. Удосконалення звичайних підходів RL у завданнях, пов’язаних із допоміжною робототехнікою, демонструється шляхом експериментів із використанням імітованих середовищ. | |
dc.format.pagerange | С. 148-154 | |
dc.identifier.citation | Tytarenko, A. Reducing risk for assistive reinforcement learning policies with diffusion models / A. Tytarenko // Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал. – 2024. – № 3. – С. 148-154 . – Бібліогр.: 12 назв. | |
dc.identifier.doi | https://doi.org/10.20535/SRIT.2308-8893.2024.3.09 | |
dc.identifier.orcid | 0000-0002-8265-642X | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/72412 | |
dc.language.iso | en | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.relation.ispartof | Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал, 2024, № 3 | |
dc.subject | assistive robotics | |
dc.subject | reinforcement learning | |
dc.subject | diffusion models | |
dc.subject | imitation learning | |
dc.subject | допоміжна робототехніка | |
dc.subject | навчання з підкріпленням | |
dc.subject | дифузійні моделі | |
dc.subject | імітаційне навчання | |
dc.subject.udc | 004.852 | |
dc.title | Reducing risk for assistive reinforcement learning policies with diffusion models | |
dc.title.alternative | Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- 315284-730152-1-10-20241116.pdf
- Розмір:
- 251.25 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: