BriefGPT.xyz
Ask
alpha
关键词
residual policy
搜索结果 - 2
Track2Act: 从互联网视频预测点轨迹实现多样化的零射击机器人操控
通过使用网络视频进行预测性互动计划的学习,结合机器人在真实世界中的任务无关转换,以及通过少量具体示范进行训练的闭环策略预测残余动作,我们提出了一种可扩展学习的路径预测方法,实现了任务零 - shot 机器人操作,并在未见任务、对象和场景上呈
→
PDF
2 months ago
学习基于评分的人类辅助灵巧抓取基元
提出了一种新的人机辅助灵巧抓取任务,该任务旨在训练一个用于控制机器人手指来辅助用户抓取物体的策略。通过提出 Grasping Gradient Field(GraspGF)和基于历史的剩余策略,解决了用户意图多样性和物体几何形状的挑战,实验
→
PDF
10 months ago
Prev
Next