Jun, 2022

基于结构化世界模型的好奇探索实现零样本物体操作

TL;DR使用结构化世界模型的内在动机强化学习算法,实现了多物体环境中的高效探索以及零样本泛化,可以完成像堆叠、翻转、拿起、投掷等任务。