探索从演示任务中机器人错误引起的人类内在反应
通过使用信息熵作为准则,建议教师给出更具信息量的示范样例,从而提高机器人学习效率。使用增强现实引导系统对初学者进行训练,从熵最高的区域产生额外的示范,并在同一任务(保留)和新任务(转移)上测试性能,结果发现机器人的学习效率大幅提高,与启发式规则相比提高了 210%。
Oct, 2023
本文提出了一种基于数据驱动的框架 EMPATHIC,该框架可以从人类面部表情等隐式反馈中学习如何优化机器人执行任务的表现,其中包括使用深度神经网络将隐式反馈转化为任务统计数据以及应用该框架在机器人操纵路径评估等多个领域的实例。
Sep, 2020
文章介绍了一种学习自演示 (LfD) 方法,用于应对带有关节机制的接触丰富的操作任务。从单个人类演示中提取的策略可以推广到相同类型的不同机制,并且对环境变化具有鲁棒性,其关键是通过与环境有目的地交互来自主增强初始演示以收集附加信息。针对多 DOF 的复杂机制的实际实验表明,我们的方法可以可靠地完成任务。
Oct, 2022
本文研究交互式机器学习的发展和应用,探讨人类反馈对于机器人行为的影响和提高机器人性能的方法,发现人类反馈参数对于任务性能的影响很大,需要更好地了解人类反馈的潜在变量以更好地处理人机交互领域的问题。
Jan, 2017
通过对 2D 场景图像进行示范轨迹草图,在三维任务空间中生成运动轨迹的概率模型,以此作为一种新型的 LfD(Learning for Demonstration)范式。
Sep, 2023
为了让人类能够很好地与机器人协作,提出了一种包含逆强化学习和演示方法,在选择展示时考虑了人类对机器人决策的预期,使用了一种新的测试难度测量方法,并发现这种方法在易于测试的情况下降低了人类的性能,但在难于测试的情况下增加了性能。
Mar, 2022
本论文介绍了如何通过微进化强化学习的方法,将人类操作技能转移到商业机器人上,同时提出了多维进化路径搜索算法以及专家人类代理政策的转移,通过实验验证了该框架的有效性。
Dec, 2022
通过概率生成模型的优化问题,使用高容量神经网络进行可解释的演示学习任务,以高层次概念对其潜在变量进行对齐,并与末端用户标签进行比较,基于两个针对桌面机器人操作的任务(用海绵擦拭和容器之间的倾倒),验证了此方法。
Jun, 2020