Sep, 2023

使用潜在信息进行视觉观察的对抗性模仿学习

TL;DR基于视觉观测的模仿学习的研究, 在部分可观察环境中, 引入了基于状态潜在转换分布的上界来分析学习代理的次优性, 并提出了一种名为潜在对抗性观测模仿学的算法, 在高维连续机器人任务中表现出与最先进的性能,同时提供显著的计算优势,并可以利用专家视频来提高从像素进行强化学习的效率。