Reducing risk for assistive reinforcement learning policies with diffusion models

Tytarenko,  Andrii

Reducing risk for assistive reinforcement learning policies with diffusion models

dc.contributor.author	Tytarenko, Andrii
dc.date.accessioned	2025-02-10T13:22:10Z
dc.date.available	2025-02-10T13:22:10Z
dc.date.issued	2024
dc.description.abstract	Care-giving and assistive robotics, driven by advancements in AI, offer promising solutions to meet the growing demand for care, particularly in the context of increasing numbers of individuals requiring assistance. It creates a pressing need for efficient and safe assistive devices, particularly in light of heightened demand due to war-related injuries. While cost has been a barrier to accessibility, techno-logical progress can democratize these solutions. Safety remains a paramount con-cern, especially given the intricate interactions between assistive robots and humans. This study explores the application of reinforcement learning (RL) and imitation learning in improving policy design for assistive robots. The proposed approach makes the risky policies safer without additional environmental interactions. The enhancement of the conventional RL approaches in tasks related to assistive robotics is demonstrated through experimentation using simulated environments.
dc.description.abstractother	Доглядова та допоміжна робототехніка, що ґрунтується на прогресі ШІ, пропонує багатообіцяючі рішення для задоволення зростаючого попиту на догляд, особливо в контексті збільшення кількості людей, які потребують допомоги. Це створює нагальну потребу в ефективних і безпечних допоміжних пристроях, особливо в світлі підвищеного попиту через травми, пов’язані з війною. Хоча вартість була перешкодою для доступності, технологічний прогрес може демократизувати ці рішення. Безпека залишається головною проблемою, особливо з огляду на складну взаємодію між допоміжними роботами та людьми. У цьому дослідженні досліджується застосування навчання з підкріпленням (RL) та імітаційного навчання для вдосконалення розробки політики для допоміжних роботів. Запропонований підхід робить ризиковані політики безпечнішими без додаткових взаємодій з навколишнім середовищем. Удосконалення звичайних підходів RL у завданнях, пов’язаних із допоміжною робототехнікою, демонструється шляхом експериментів із використанням імітованих середовищ.
dc.format.pagerange	С. 148-154
dc.identifier.citation	Tytarenko, A. Reducing risk for assistive reinforcement learning policies with diffusion models / A. Tytarenko // Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал. – 2024. – № 3. – С. 148-154 . – Бібліогр.: 12 назв.
dc.identifier.doi	https://doi.org/10.20535/SRIT.2308-8893.2024.3.09
dc.identifier.orcid	0000-0002-8265-642X
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/72412
dc.language.iso	en
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.relation.ispartof	Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал, 2024, № 3
dc.subject	assistive robotics
dc.subject	reinforcement learning
dc.subject	diffusion models
dc.subject	imitation learning
dc.subject	допоміжна робототехніка
dc.subject	навчання з підкріпленням
dc.subject	дифузійні моделі
dc.subject	імітаційне навчання
dc.subject.udc	004.852
dc.title	Reducing risk for assistive reinforcement learning policies with diffusion models
dc.title.alternative	Зниження ризиків стратегій навчання з підкріпленням для догляду із дифузійними моделями
dc.type	Article

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 315284-730152-1-10-20241116.pdf
Розмір:: 251.25 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Системні дослідження та інформаційні технології: міжнародний науково-технічний журнал, № 3