共享自治中的干预优化

AAAIDec, 2021

On Optimizing Interventions in Shared Autonomy

Weihao Tan, David Koleczek, Siddhant Pradhan, Nicholas Perello, Vivek Chettiar...

TL;DR研究共享自治的方法，提高人类与自主代理合作的绩效和用户体验，提出两种模型无关的强化学习方法来限制自治代理干预的数量，并比基线表现更好。

Abstract

shared autonomy refers to approaches for enabling an autonomous agent to collaborate with a human with the aim of improving human performance. However, besides improving performance, it may often also be benefici

shared autonomy autonomous agent reinforcement learning user experience interventions

发现论文，激发创造

基于深度强化学习的共享自治

论文提出了一种深度强化学习框架，结合人类输入与半自治控制，通过学习用户意图，帮助用户在实时控制任务中实现目标，成果是一种灵活、实用的辅助系统。

Feb, 2018

在线学习共享自治中的人类约束

通过学习和适应人体约束，实现实时协作的增强助理智能体在共享自主模式下帮助人类操作者尽可能地减轻工作负荷和不适感。

Mar, 2024

面向终身共享自治的情境信心辅助

共享自主能力使机器人能够推断用户的意图并协助完成任务。然而，当用户想要完成机器人不了解的新任务时，共享自主将阻碍其性能。本文提出机器人可以检测到其意图表述能力的不足并将控制权交还给用户来实现任务，从而使机器人能够进行无阻碍的任务执行并学习到新的意图来更新自己的意图库，并展示了该方法的良好表现和能够实现的全生命周期学习。

Apr, 2021

共享自主权的残差策略学习

提出了一种模型自由、剩余策略学习算法来实现共享自主，将人与机器人的互补优势结合起来，以实现共同的目标，在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试，表明此方法可以显著提高任务绩效。

Apr, 2020

共享自治中的人机相互适应

我们的研究旨在通过一套合理的人机相互适应形式化方法，将有限记忆人类的行为方式融入到部分可观测的随机决策模型中，以改善人机团队的表现并保留对机器人的信任。

Jan, 2017

透过事后优化共享自主性

本研究使用部分可观察马尔可夫决策过程来模拟共享自动化中的用户意图不确定性，并采用最大熵逆优化控制来估算用户目标的分布。研究还使用后见优化技术近似解决了优化问题。用户实验结果表明，该方法可以更快地完成任务，同时使用的输入较少，但用户对任务完成速度和控制权之间的平衡存在不同的评价。

Mar, 2015

学习潜在行为的共享自主性

本文介绍了一种结合了共享自主系统和学习潜在动作的方法，用于实现精确的援助机器人操作，主要集中在维度减少技术和对象操作方面。

May, 2020

透过事后优化实现遥控和团队合作的共享自主权

本研究使用部分可观察的马尔可夫决策过程（POMDP）建立了共享自主体系的模型，实现了在未知目标目的情况下，最小化期望成本并提供有用的援助，比传统预测 - 执行方法更快，需要更少的用户输入，减少用户闲置时间并减少用户与机器人的碰撞。

Jun, 2017

优化协作人工智能混合团队中的委托

人类和自主系统作为混合团队操作时，通过引入 AI 经理（通过强化学习学习团队的行为模型），在最大程度提高团队的综合性能的同时，最大限度减少 AI 经理介入的频率。

Feb, 2024

具有自主性的远程操作，应用于脑机接口操纵

使用视觉、用户意图推断和人机共同控制的框架，旨在解决机器人远程操作系统中的挑战，同时缓解大脑 - 计算机接口下的噪音和错误低维度运动指令问题。我们使用共同控制辅助框架对两个使用了颅内脑机接口的受试者进行实验，并取得了显着的性能提升，在门的开启、从容器中倒液体和在密集且杂乱的环境中使用新型物品等任务中进一步展示了我们架构的可扩展性。

Mar, 2015