Jul, 2023

学习非刚性抓姿注册的通用工具使用

TL;DR通过我们提出的一种新方法,仅使用单个演示,我们实现了工具使用行为的强化学习,通过给予初值设定和形状奖励信号的引导来解决多指机械手抓取配置的推广问题,并实现复杂的工具使用任务并在测试时推广到未见过的工具。