ICLRApr, 2021

增强世界模型促进从单个脱机环境实现零样本动态泛化

TL;DR本论文介绍了如何在在线环境中使用增强世界模型来改善零样本泛化,从而提高强化学习的性能。