探索从演示任务中机器人错误引起的人类内在反应

MMJun, 2016

探索从演示任务中机器人错误引起的人类内在反应

Exploring Implicit Human Responses to Robot Mistakes in a Learning from Demonstration Task

Cory J. Hayes, Maryam Moosaei, Laurel D. Riek

TL;DR该研究探讨了通过学习人类示教实现机器人互动反馈的一种可能性 —— 基于双方肢体语言的意义建立，通过人机互动教机器人跳舞，对正确和错误示范进行姿态分析以测量人对机器人的响应。

Abstract

As robots enter human environments, they will be expected to accomplish a tremendous range of tasks. It is not feasible for robot designers to pre-program these behaviors or know them in advance, so one way to address this is through →

robots end-user programming learning from demonstration human-robot interaction gesture analysis

发现论文，激发创造

如何通过示范高效地教导机器人？

通过使用信息熵作为准则，建议教师给出更具信息量的示范样例，从而提高机器人学习效率。使用增强现实引导系统对初学者进行训练，从熵最高的区域产生额外的示范，并在同一任务（保留）和新任务（转移）上测试性能，结果发现机器人的学习效率大幅提高，与启发式规则相比提高了 210%。

Oct, 2023

基于隐式人类反馈的任务学习 EMPATHIC 框架

本文提出了一种基于数据驱动的框架 EMPATHIC，该框架可以从人类面部表情等隐式反馈中学习如何优化机器人执行任务的表现，其中包括使用深度神经网络将隐式反馈转化为任务统计数据以及应用该框架在机器人操纵路径评估等多个领域的实例。

Sep, 2020

基于环境限制的示教学习增强

文章介绍了一种学习自演示 (LfD) 方法，用于应对带有关节机制的接触丰富的操作任务。从单个人类演示中提取的策略可以推广到相同类型的不同机制，并且对环境变化具有鲁棒性，其关键是通过与环境有目的地交互来自主增强初始演示以收集附加信息。针对多 DOF 的复杂机制的实际实验表明，我们的方法可以可靠地完成任务。

Oct, 2022

基于强化学习的具身智能体通过互动与多感知模拟对人类用户进行建模

本文研究交互式机器学习的发展和应用，探讨人类反馈对于机器人行为的影响和提高机器人性能的方法，发现人类反馈参数对于任务性能的影响很大，需要更好地了解人类反馈的潜在变量以更好地处理人机交互领域的问题。

Jan, 2017

通过概率图示教学进行示范学习

通过对 2D 场景图像进行示范轨迹草图，在三维任务空间中生成运动轨迹的概率模型，以此作为一种新型的 LfD（Learning for Demonstration）范式。

Sep, 2023

通过自监督奖励回归学习低效演示

本文提出了一种新的方法通过子优示范来合成优化参数化的数据来训练理想的奖励函数，从而克服了旧方法在使用子优示范时的一些限制，实现了更好的性能。

Oct, 2020

推理反事实以改善人类逆强化学习

为了让人类能够很好地与机器人协作，提出了一种包含逆强化学习和演示方法，在选择展示时考虑了人类对机器人决策的预期，使用了一种新的测试难度测量方法，并发现这种方法在易于测试的情况下降低了人类的性能，但在难于测试的情况下增加了性能。

Mar, 2022

多人模仿学习中的兼容演示引导

研究通过基于人提供的演示的模仿学习来学习机器人操作策略，通过测量新演示与基本策略的兼容性并积极征求新用户的兼容演示，从而改善任务成功率。

Oct, 2022

HERD: 持续人机进化的学习人类示范方法

本论文介绍了如何通过微进化强化学习的方法，将人类操作技能转移到商业机器人上，同时提出了多维进化路径搜索算法以及专家人类代理政策的转移，通过实验验证了该框架的有效性。

Dec, 2022

弱监督分解学习中的示范学习

通过概率生成模型的优化问题，使用高容量神经网络进行可解释的演示学习任务，以高层次概念对其潜在变量进行对齐，并与末端用户标签进行比较，基于两个针对桌面机器人操作的任务（用海绵擦拭和容器之间的倾倒），验证了此方法。

Jun, 2020