Multi-step prediction in linearized latent state spaces for representation learning

Tytarenko, A.

Multi-step prediction in linearized latent state spaces for representation learning

dc.contributor.author	Tytarenko, A.
dc.date.accessioned	2023-05-01T14:12:33Z
dc.date.available	2023-05-01T14:12:33Z
dc.date.issued	2022
dc.description.abstract	In this paper, we derive a novel method as a generalization over LCEs such as E2C. The method develops the idea of learning a locally linear state space by adding a multi-step prediction, thus allowing for more explicit control over the curvature. We show that the method outperforms E2C without drastic model changes which come with other works, such as PCC and P3C. We discuss the relation between E2C and the presented method and derive update equations. We provide empirical evidence, which suggests that by considering the multi-step prediction, our method – ms-E2C – allows learning much better latent state spaces in terms of curvature and next state predictability. Finally, we also discuss certain stability challenges we encounter with multi-step predictions and how to mitigate them.	uk
dc.description.abstractother	Запропоновано новий метод, що узагальнює підходи LCE, такі як E2C. Метод розвиває ідею вивчення локально-лінійного простору станів шляхом розглядання багатокрокового прогнозування, що дає змогу чіткіше контролювати кривизну шуканого простору. Продемонстровано, що метод перевершує E2C без суттєвих змін загальної моделі, на відміну від інших робіт, таких як PCC і P3C. Розглянуто зв’язок між E2C і запропонованим методом та між їх відповідними рівняннями оновлень. Подано емпіричні докази, які свідчать, що ms-E2C дозволяє набагато краще вивчати простори прихованих станів з точки зору кривизни та прогнозованості наступних станів. Крім того, висвітлено певні проблеми стабільності, пов’язані з багатокроковими прогнозами, та способи їх вирішення.	uk
dc.format.pagerange	С. 139-148	uk
dc.identifier.citation	Tytarenko, A. Multi-step prediction in linearized latent state spaces for representation learning / A. Tytarenko // Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал. – 2022. – № 3. – С. 139-148. – Бібліогр.: 18 назв.	uk
dc.identifier.doi	https://doi.org/10.20535/SRIT.2308-8893.2022.3.09
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/55156
dc.language.iso	en	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.relation.ispartof	Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал, № 3	uk
dc.subject	representation learning	uk
dc.subject	learning controllable embedding	uk
dc.subject	reinforcement learning	uk
dc.subject	latent state space	uk
dc.subject	навчання репрезентацій	uk
dc.subject	навчання керованих просторів	uk
dc.subject	навчання з підкріпленням	uk
dc.subject	латентний простір станів	uk
dc.subject.udc	004.852	uk
dc.title	Multi-step prediction in linearized latent state spaces for representation learning	uk
dc.title.alternative	Багатокрокове прогнозування в лінеаризованих латентних просторах для навчання репрезинтацій	uk
dc.type	Article	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 2022_3_139-148.pdf
Розмір:: 322.33 KB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.1 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Системні дослідження та інформаційні технології: міжнародний науково-технічний журнал, № 3