Dec, 2020

学习跨域控制与动力学循环一致性对应

TL;DR本文提出了利用动态循环 (Dynamics Cycles) 的方法,通过在两个不同的领域中学习关联来解决机器人学习中的问题,包括模仿学习、模拟到真实世界的迁移学习和不同机器人环境之间的转移学习。该方法可以通过使用来自两个不同领域的非配对和随机收集的数据,对代表 (视觉 / 内部状态)、物理参数 (质量 / 摩擦力) 和形态 (肢体数量) 不同的两个领域进行对齐,最终在不需要任何额外的微调的情况下将一个领域的策略直接转移至另一个领域。