共享自主权的残差策略学习

Apr, 2020

Residual Policy Learning for Shared Autonomy

Charles Schaff, Matthew R. Walter

TL;DR提出了一种模型自由、剩余策略学习算法来实现共享自主，将人与机器人的互补优势结合起来，以实现共同的目标，在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试，表明此方法可以显著提高任务绩效。

Abstract

shared autonomy provides an effective framework for human-robot collaboration that takes advantage of the complementary strengths of humans and robots to achieve common goals. Many existing approaches to

shared autonomy human-robot collaboration policy learning continuous control environments reinforcement learning

发现论文，激发创造

基于深度强化学习的共享自治

论文提出了一种深度强化学习框架，结合人类输入与半自治控制，通过学习用户意图，帮助用户在实时控制任务中实现目标，成果是一种灵活、实用的辅助系统。

Feb, 2018

在线学习共享自治中的人类约束

通过学习和适应人体约束，实现实时协作的增强助理智能体在共享自主模式下帮助人类操作者尽可能地减轻工作负荷和不适感。

Mar, 2024

学习潜在行为的共享自主性

本文介绍了一种结合了共享自主系统和学习潜在动作的方法，用于实现精确的援助机器人操作，主要集中在维度减少技术和对象操作方面。

May, 2020

透过事后优化共享自主性

本研究使用部分可观察马尔可夫决策过程来模拟共享自动化中的用户意图不确定性，并采用最大熵逆优化控制来估算用户目标的分布。研究还使用后见优化技术近似解决了优化问题。用户实验结果表明，该方法可以更快地完成任务，同时使用的输入较少，但用户对任务完成速度和控制权之间的平衡存在不同的评价。

Mar, 2015

共享自治中的干预优化

研究共享自治的方法，提高人类与自主代理合作的绩效和用户体验，提出两种模型无关的强化学习方法来限制自治代理干预的数量，并比基线表现更好。

Dec, 2021

共享自治中的人机相互适应

我们的研究旨在通过一套合理的人机相互适应形式化方法，将有限记忆人类的行为方式融入到部分可观测的随机决策模型中，以改善人机团队的表现并保留对机器人的信任。

Jan, 2017

面向终身共享自治的情境信心辅助

共享自主能力使机器人能够推断用户的意图并协助完成任务。然而，当用户想要完成机器人不了解的新任务时，共享自主将阻碍其性能。本文提出机器人可以检测到其意图表述能力的不足并将控制权交还给用户来实现任务，从而使机器人能够进行无阻碍的任务执行并学习到新的意图来更新自己的意图库，并展示了该方法的良好表现和能够实现的全生命周期学习。

Apr, 2021

透过事后优化实现遥控和团队合作的共享自主权

本研究使用部分可观察的马尔可夫决策过程（POMDP）建立了共享自主体系的模型，实现了在未知目标目的情况下，最小化期望成本并提供有用的援助，比传统预测 - 执行方法更快，需要更少的用户输入，减少用户闲置时间并减少用户与机器人的碰撞。

Jun, 2017

基于策略分解的人工智能共享控制

本文介绍了一种基于频率的方法（Policy Dissection）用于 Reinforcement Learning (RL) 方法中的人机共享控制，该方法可将 RL 训练过的策略转化为可以与人类互动的策略，并在自动驾驶和动力学任务中进行了实验。

May, 2022

最小化人力成本的演示学习框架

本文探讨了机器人学习中的共享自治问题，提出了一种基于多臂赌博机算法的控制器选择方法，并通过模拟和实现任务验证了该方法降低了人类成本。

Jun, 2023