ICLRApr, 2018

零样本视觉模仿

TL;DR本文提出了一种无需专家指导,在探索环境中通过前向一致性损失生成目标导向的技能策略,并应用其中的零样本策略,成功地实现了 Baxter 机器人复杂绳子操作和 TurtleBot 在未知办公室环境中的导航。