从人类反馈学习机器人到人类的动态物体递交

Mar, 2016

从人类反馈学习机器人到人类的动态物体递交

Learning Dynamic Robot-to-Human Object Handover from Human Feedback

Andras Kupcsik, David Hsu, Wee Sun Lee

TL;DR本文介绍了一种基于学习算法的动态物体移交方法，通过与人类交互学习物体移交的潜在报酬，使机器人能够自然地适应人体运动的动态，并通过上下文策略搜索来建立问题模型。

Abstract

object handover is a basic, but essential capability for robots interacting with humans in many applications, e.g., caring for the elderly and assisting workers in manufacturing workshops. It appears deceptively simple, as humans perform →

object handover robot-human interaction learning algorithm contextual policy search latent reward

发现论文，激发创造

接触交接：基于接触引导的机器人到人的物品交接

机器人到人的物体交接是许多人机协作任务中的重要一步，我们提出了一种基于接触的机器人到人交接系统 ContactHandover，它由抓取阶段和交付阶段组成，通过预测机器人抓取姿势和对象上人体接触点的三维可行性图，最大化接触点接近人类并最小化人体关节扭矩和位移，以实现更好的接触可见性和可及性。

Apr, 2024

动态移交：双手挥动和接住

设计了一个系统，其中包含两只附着在机器人手臂上的多指手，用于解决机器人在高速操作、精确协作和与不同对象进行交互时面临的挑战。通过在模拟中使用多智能体强化学习训练，并进行 Sim2Real 转移以在真实机器人上实施，提供了多个创新算法设计，包括学习物体的轨迹预测模型，帮助机器人准确估计物体的移动方向并做出相应反应。通过在真实环境中使用多个物体进行实验，相较于多个基准线表现出显著改进。项目页面可在 https://binghao-huang.github.io/dynamic_handover/ 访问。

Sep, 2023

从点云中学习人与机器人之间的交接

本研究提出了第一个适用于基于视觉的人机递送控制策略学习的框架，使用带动态仿真环境的两阶段教师 - 学生框架，该框架使用运动规划、抓握规划、强化学习和自我监督等方法，可以在模拟实验基准测试、模拟到模拟的转换和模拟到真实的转换中显著提高性能，同时该研究也为解决仿真人类问题提供了新的思路。

Mar, 2023

SynH2R：用于学习人机交接的合成手 - 物体动作

通过引入适合训练机器人的合成数据，我们提出了一个能够生成逼真人类抓取动作的框架，通过对合成数据的纯训练，证明了我们的方法在模拟环境和真实系统中与依赖真实人类动作数据的最先进方法相媲美，并且能够扩展到更多未知物体和人类动作的大规模评估。

Nov, 2023

运动约束的类人双臂机器人与人的交接

提出了一个框架来生成运动学约束的类人双手机器人运动，以确保人与机器之间物体的顺畅和自然的交接。通过使用隐藏半马尔可夫模型（HSMM）根据观察到的人的动作生成适当的响应轨迹，通过任务空间约束调整轨迹以确保准确的递交。通过一项试点研究的结果表明，与基线逆运动学方法相比，我们的方法被认为更类似于人类。

Feb, 2024

人机间间接握手的先发制人运动规划

该研究介绍了一种预测和规划机制，该机制通过目光和手势作为模型输入来预测人类意图，并实时移动向人类指定的位置，以实现人机协作的高效安全的物体递交。

Mar, 2022

HERD: 持续人机进化的学习人类示范方法

本论文介绍了如何通过微进化强化学习的方法，将人类操作技能转移到商业机器人上，同时提出了多维进化路径搜索算法以及专家人类代理政策的转移，通过实验验证了该框架的有效性。

Dec, 2022

多模态交接失败检测数据集与基线

人机交接的失败检测及数据集构建方法研究。

Feb, 2024

实时动态机器人辅助手 - 物体交互基于动作基元

提出一种基于动态机器人辅助手物交互的方法，通过手部姿态估计、自适应机器人控制和运动原语的综合运用，在实现精确任务执行和适应实时动作方面提高了人机物理交互的效果。

May, 2024

从人类示范中学习软体机器手的熟练操作

本文介绍了一种基于物体为中心示范实现的，用于训练软机械手进行熟练操作的方法，该方法使用增强学习技术，提出了一种新的算法，允许我们混合和选择最可行的示范来学习在硬件上模仿。最后，我们将这种方法应用于 RBO Hand 2 上，并获得了开 / 关阀门，滑珠和抓取等任务的良好表现。

Mar, 2016