Apr, 2020
共享自主权的残差策略学习
Residual Policy Learning for Shared Autonomy
Charles Schaff, Matthew R. Walter
TL;DR提出了一种模型自由、剩余策略学习算法来实现共享自主,将人与机器人的互补优势结合起来,以实现共同的目标,在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试,表明此方法可以显著提高任务绩效。
Abstract
shared autonomy provides an effective framework for human-robot collaboration
that takes advantage of the complementary strengths of humans and robots to
achieve common goals. Many existing approaches to
shared autonomyhuman-robot collaborationpolicy learningcontinuous control environmentsreinforcement learning
发现论文,激发创造
透过事后优化共享自主性
本研究使用部分可观察马尔可夫决策过程来模拟共享自动化中的用户意图不确定性,并采用最大熵逆优化控制来估算用户目标的分布。研究还使用后见优化技术近似解决了优化问题。用户实验结果表明,该方法可以更快地完成任务,同时使用的输入较少,但用户对任务完成速度和控制权之间的平衡存在不同的评价。
Mar, 2015
面向终身共享自治的情境信心辅助
共享自主能力使机器人能够推断用户的意图并协助完成任务。然而,当用户想要完成机器人不了解的新任务时,共享自主将阻碍其性能。本文提出机器人可以检测到其意图表述能力的不足并将控制权交还给用户来实现任务,从而使机器人能够进行无阻碍的任务执行并学习到新的意图来更新自己的意图库,并展示了该方法的良好表现和能够实现的全生命周期学习。
Apr, 2021
透过事后优化实现遥控和团队合作的共享自主权
本研究使用部分可观察的马尔可夫决策过程(POMDP)建立了共享自主体系的模型,实现了在未知目标目的情况下,最小化期望成本并提供有用的援助,比传统预测 - 执行方法更快,需要更少的用户输入,减少用户闲置时间并减少用户与机器人的碰撞。
Jun, 2017
基于策略分解的人工智能共享控制
本文介绍了一种基于频率的方法(Policy Dissection)用于 Reinforcement Learning (RL) 方法中的人机共享控制,该方法可将 RL 训练过的策略转化为可以与人类互动的策略,并在自动驾驶和动力学任务中进行了实验。
May, 2022