学习非刚性抓姿注册的通用工具使用

Jul, 2023

学习非刚性抓姿注册的通用工具使用

Learning Generalizable Tool Use with Non-rigid Grasp-pose Registration

Malte Mosbach, Sven Behnke

TL;DR通过我们提出的一种新方法，仅使用单个演示，我们实现了工具使用行为的强化学习，通过给予初值设定和形状奖励信号的引导来解决多指机械手抓取配置的推广问题，并实现复杂的工具使用任务并在测试时推广到未见过的工具。

Abstract

tool use, a hallmark feature of human intelligence, remains a challenging problem in robotics due the complex contacts and high-dimensional action space. In this work, we present a novel method to enable

tool use robotics reinforcement learning grasping configurations policy search

发现论文，激发创造

通过轨迹生成学习通用工具使用技能

通过生成模型学习工具使用轨迹和对应工具位姿的序列，以实现对变形物体的操纵，进而提高自治系统在常见任务（如烹饪和清洁）中的智能水平。

Sep, 2023

从人类抓握机会学习具有普适性的熟练操作

本研究提出了使用大规模演示学习熟练操作多指手来处理机器人学中最具挑战性的问题。主要采用人类抓握可行性模型生成 3D 物体演示，以实现策略的泛化。同时，本研究使用了新颖的模仿学习目标，以及几何表示学习目标，通过在仿真系统中重新定位多样的对象以证明本方法的有效性。

Apr, 2022

学习基于评分的人类辅助灵巧抓取基元

提出了一种新的人机辅助灵巧抓取任务，该任务旨在训练一个用于控制机器人手指来辅助用户抓取物体的策略。通过提出 Grasping Gradient Field（GraspGF）和基于历史的剩余策略，解决了用户意图多样性和物体几何形状的挑战，实验证明了该方法在实际应用中的用户感知和实用性的优越性。

Sep, 2023

学习设计和使用机器人操纵工具

通过深度学习和强化学习相结合的方法，本文提出了一种学习策略来解决机器人的操纵任务，并展示了比先前方法更高的样本效率、对未见过任务的适应性以及在实际约束条件下复杂性设计和控制策略之间的权衡。

Nov, 2023

使用引导式策略搜索学习接触丰富型操作技能

本文介绍了一种用于学习具有高度通用策略表示的动态操作行为的新方法，该方法可以扩展最近开发的策略搜索方法，并使用迭代重新拟合的时间变化线性模型来学习所需运动技能的一组轨迹，然后将这些轨迹统一到一个单一的控制策略中。

Jan, 2015

使用参数化操作基元学习外在灵巧性

通过学习层次化强化学习，我们能够利用环境改变目标物体的姿态，无需物体检测、姿态估计或手动设计控制器，从而成功地完成 98% 的实验任务。

Oct, 2023

基于强化学习的物体几何形态高效表征与互动抓取策略学习

本文提出一种基于强化学习的框架，通过连续地控制一个类人机械手，学习各种几何不同的实际物体的交互抓取。该框架在物体几何的显式表示方面进行了探索，并且通过符号距离隐式地指导搜索，最终表现出在更具挑战性的条件下学习的能力。

Nov, 2022

学习灵巧的手中操纵

通过强化学习，我们使用模拟环境训练了一种可以使机器人手指进行多指协调、操纵物体并控制重力的新型算法，并且证明该算法可以成功地应用在实物机器人中，为机器人控制领域提供了新的解决方案。

Aug, 2018

从人类示范中学习软体机器手的熟练操作

本文介绍了一种基于物体为中心示范实现的，用于训练软机械手进行熟练操作的方法，该方法使用增强学习技术，提出了一种新的算法，允许我们混合和选择最可行的示范来学习在硬件上模仿。最后，我们将这种方法应用于 RBO Hand 2 上，并获得了开 / 关阀门，滑珠和抓取等任务的良好表现。

Mar, 2016

物理引导的分层奖励机制用于学习式物体抓取

本文提出了基于物理引导的深度强化学习方法用于改善学习效率和推广性，在多指机器人手势能力的数据集上进行测试，结果表明，该方法在任务性能方面优于标准深度强化学习方法 48% 和学习效率 40%。

May, 2022