Nov, 2019

分层解耦控制器的第三人称视觉模仿学习

TL;DR研究对象学习通用设置,构建代理可从第三人称的视频中学习并操作未见过的物体,通过分层式结构实现,高级模块生成子目标序列,低级控制器实施,无需完整状态信息,实验展示在 Baxter 机器人上完成倒和放置物体等操作。