Feb, 2023

DITTO: 带有全局模型的离线模仿学习

TL;DR使用物理世界模型和在线强化学习,本文提出了一种 DITTO 的离线模仿学习算法,用于解决协变量转移的问题,并通过 Atari 游戏环境测试表明,在线学习性能已经达到了最先进水平。