BriefGPT.xyz
Ask
alpha
关键词
universal policy learning
搜索结果 - 1
一次性模仿学习与不变量匹配在机器人操作中的应用
通过学习不变区域和匹配测试环境中的不变区域,Invariance-Matching One-shot Policy Learning(IMOP)算法可以从单个未标注的演示中学习新任务,并取得显著的成功率提高。
PDF
2 months ago
Prev
Next