May, 2022

Iso-Dream:隔离并利用世界模型中不可控制的视觉动态

TL;DR本文提出了一种基于强化学习的新方法 Iso-Dream,通过优化逆动力学,鼓励世界模型学习隔离状态之间的可控和不可控源的时空变化,并优化代理在分离的潜在想象中的行为,有效地分离了复杂的动力学,并在一系列视觉控制和预测任务中显著优于现有方法。