ICMLMay, 2020

通过自监督世界模型规划探索

TL;DRPlan2Explore 是一种无须任务特定交互且能够通过自监督探索和快速适应新任务的强化学习机器人,利用计划来探求未来预期的新颖性并在零次或少次学习中快速适应新任务。