本研究使用部分可观察马尔可夫决策过程来模拟共享自动化中的用户意图不确定性,并采用最大熵逆优化控制来估算用户目标的分布。研究还使用后见优化技术近似解决了优化问题。用户实验结果表明,该方法可以更快地完成任务,同时使用的输入较少,但用户对任务完成速度和控制权之间的平衡存在不同的评价。
Mar, 2015
共享自主能力使机器人能够推断用户的意图并协助完成任务。然而,当用户想要完成机器人不了解的新任务时,共享自主将阻碍其性能。本文提出机器人可以检测到其意图表述能力的不足并将控制权交还给用户来实现任务,从而使机器人能够进行无阻碍的任务执行并学习到新的意图来更新自己的意图库,并展示了该方法的良好表现和能够实现的全生命周期学习。
Apr, 2021
本文概述了机器人与人合作的概率规划和博弈论算法的研究,包括不确定性建模和对人类内部状态和变化的推理,以及在多个实际场景下实现的具体行为。
Jul, 2017
通过学习和适应人体约束,实现实时协作的增强助理智能体在共享自主模式下帮助人类操作者尽可能地减轻工作负荷和不适感。
Mar, 2024
本研究使用部分可观察的马尔可夫决策过程(POMDP)建立了共享自主体系的模型,实现了在未知目标目的情况下,最小化期望成本并提供有用的援助,比传统预测 - 执行方法更快,需要更少的用户输入,减少用户闲置时间并减少用户与机器人的碰撞。
Jun, 2017
论文提出了一种深度强化学习框架,结合人类输入与半自治控制,通过学习用户意图,帮助用户在实时控制任务中实现目标,成果是一种灵活、实用的辅助系统。
Feb, 2018
研究人机协作中的不完全适应现象,提出一种基于博弈论的人机部分适应模型,实验结果显示该模型显著提高了人机团队的性能。
Jan, 2017
提出了一种模型自由、剩余策略学习算法来实现共享自主,将人与机器人的互补优势结合起来,以实现共同的目标,在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试,表明此方法可以显著提高任务绩效。
Apr, 2020
该研究基于情境评估,提出了一种新颖的解决方案,可以在人机团队合作中帮助机器人预测和模拟人类决策,并通过沟通协调达到信念一致,提高问题解决效率和鲁棒性。
Oct, 2022
研究共享自治的方法,提高人类与自主代理合作的绩效和用户体验,提出两种模型无关的强化学习方法来限制自治代理干预的数量,并比基线表现更好。
Dec, 2021