Jun, 2022

面具世界模型的视觉控制

TL;DR通过自编码器和动态学习的分离以及辅助奖励预测目标的引入,提出了一种新的视觉模型 RL 框架,取得了 Meta-world 和 RLBench 的 50 项任务中,81.7% 的成功率的表现。