Oct, 2022

MoCoDA: 基于模型的反事实数据增强

TL;DR本文提出一种利用局部分解结构的动力学模型、试验数据增强等方法的强化学习算法,该算法在离线学习方面比标准算法可显著提升其在超出分布范围的机器人操作任务中的性能表现。