基于策略分解的人工智能共享控制

May, 2022

基于策略分解的人工智能共享控制

Human-AI Shared Control via Policy Dissection

Quanyi Li, Zhenghao Peng, Haibin Wu, Lan Feng, Bolei Zhou

TL;DR本文介绍了一种基于频率的方法（Policy Dissection）用于 Reinforcement Learning (RL) 方法中的人机共享控制，该方法可将 RL 训练过的策略转化为可以与人类互动的策略，并在自动驾驶和动力学任务中进行了实验。

Abstract

human-ai shared control allows human to interact and collaborate with AI to accomplish control tasks in complex environments. Previous Reinforcement Learning (RL) methods attempt the goal-conditioned design to achieve human-controllable policies at the cost of redesigning the reward fu

human-ai shared control reinforcement learning policy dissection autonomous driving locomotion

发现论文，激发创造

共享自主权的残差策略学习

提出了一种模型自由、剩余策略学习算法来实现共享自主，将人与机器人的互补优势结合起来，以实现共同的目标，在 Lunar Lander 和 6-DOF quadrotor reaching task 两个连续控制环境中测试，表明此方法可以显著提高任务绩效。

Apr, 2020

基于深度强化学习的共享自治

论文提出了一种深度强化学习框架，结合人类输入与半自治控制，通过学习用户意图，帮助用户在实时控制任务中实现目标，成果是一种灵活、实用的辅助系统。

Feb, 2018

现实世界复杂环境中的人工智能协作与强化学习

在复杂的模拟环境中，研究表明人工智能与人类的合作胜过仅有人类或仅有人工智能代理的情况，并开发出了一种用户界面，使人类有效地协助人工智能代理。

Dec, 2023

人本机制设计与民主人工智能

通过 Democratic AI 方法，使用强化学习算法在参与者中探讨和设计社交机制来解决人工智能与人类价值观的对齐问题，有效缓解了财富分配不均，制止了搭便车行为并成功地赢得了大众的信任和认可。

Jan, 2022

辅助人类进行运动控制任务的教学

提出了一种利用强化学习中的技能发现方法来辅助教授机动控制任务，并通过混合合成和用户研究证明使用技能辅助教学方法能提高学生绩效 40％，个性化教学可进一步提高 25％。

Nov, 2022

实际人机协作强化学习

本研究通过一个协同迷宫游戏设计，用深度强化学习技术实现了人机共同协作。研究结果证明人机共同协作相互影响，在时间的推进下不断适应并建立起相应策略，这为人机智能的协作提供了可行的方案。

Mar, 2020

探索辅助机器人臂的 AI 增强共享控制

论文探讨了如何将人工智能集成到共享控制范式中，特别关注了人与机器人之间接口的要求和如何在显著减少心理负担和所需的运动技能的同时保持人的参与。

Jun, 2023

最小化人力成本的演示学习框架

本文探讨了机器人学习中的共享自治问题，提出了一种基于多臂赌博机算法的控制器选择方法，并通过模拟和实现任务验证了该方法降低了人类成本。

Jun, 2023

基于数据驱动的高度并行化最小干预共享控制 MPC

本研究提出了一种基于数据驱动的联合人机系统的共享控制范式，旨在不限制用户的能力以实现未指定的行为，大幅提高系统安全性和用户满意度。

Jun, 2019

通过人类规正化搜索和学习，实现人类和人工智能的协同

利用针对人类的数据规范化搜索方法及行为克隆技术，开发了一种三步算法来在不完全可观测的完全合作环境中与真人协作，该算法在 Hanabi 基准测试中表现出强大的协调性。

Oct, 2022