BriefGPT.xyz
Ask
alpha
关键词
robot manipulation skills
搜索结果 - 3
HERD: 持续人机进化的学习人类示范方法
本论文介绍了如何通过微进化强化学习的方法,将人类操作技能转移到商业机器人上,同时提出了多维进化路径搜索算法以及专家人类代理政策的转移,通过实验验证了该框架的有效性。
PDF
2 years ago
ICLR
VIP:通过价值内隐预训练实现通用视觉奖励和表示
本研究提出了一种称为 VIP 的表示自学习方法,通过自监督目标条件强化学习的方式从未标注的人类视频中生成稠密的,可平滑的奖励函数,克服机器人数据获取上的困难,并在实验中表现出优异的表现。
PDF
2 years ago
使用远程遥操作的人在循环中模仿学习
本文介绍使用干预性策略学习的方法来解决机器人操作任务中必须经过精确定序的地方的问题,提出一种 6 自由度机器人操作任务的数据采集系统,并开发了一个简单而有效的算法来收集新数据以遍历通过这些难点,使用干预策略学习的代理在机器人的线路穿线任务和
→
PDF
4 years ago
Prev
Next