May, 2023

全身移动操纵的因果策略梯度

TL;DR本文介绍了新的 MoMa 框架 ——Causal MoMa,采用因果策略学习过程,自动发现行为之间的因果依赖,并在不同类型的仿真机器人及真实机器人上取得成功。