IJCAIOct, 2020

在第一人称模拟 3D 环境中,针对稀疏奖励对象交互任务的强化学习

TL;DR本文介绍了一种无监督学习表示对象并执行物品交互任务的方法,它采用自主注意对象模型作为辅助任务,并在 AI2Thor 虚拟环境中进行测试。实验结果表明,该方法比其他辅助任务更快地学习成功率高。