通过竞争监管：为学习任务创建机器人对手

Oct, 2016

通过竞争监管：为学习任务创建机器人对手

Supervision via Competition: Robot Adversaries for Learning Tasks

Lerrel Pinto, James Davidson, Abhinav Gupta

TL;DR本文介绍了一个使用对抗学习进行机器人控制和规划的新框架，展示了该方法能够更好地训练机器人抓取模型并比合作式多机器人更加有效。

Abstract

There has been a recent paradigm shift in robotics to data-driven learning for planning and control. Due to large number of experiences required for training, most of these approaches use a self-supervised paradi

robotics data-driven learning adversarial learning grasping model multiple robots

发现论文，激发创造

强对抗学习

本文提出了一种名为 “学习强对抗” 的新方法来从有监督数据中学习强健的分类器，其中利用一种新的和简单的对抗性样本寻找方法来改善分类模型的鲁棒性。

Nov, 2015

通过对抗强化学习提高自动驾驶车辆控制的稳健性和安全性

该研究比较了 Robust Adversarial Reinforcement Learning 和 Neural Fictitious Self Play 算法在自动驾驶场景下的性能表现，将学习问题定义为自主系统与环境干扰之间的两人博弈，扩展为半竞争的情况，结果表明对手更好地捕捉了有意义的干扰，从而产生了更好的驾驶效率和减少了与传统强化学习方法相比的碰撞率。

Mar, 2019

通过对粗略局部演示进行对抗性模仿来学习敏捷技能

提出一种基于生成对抗学习的方法，通过从部分不兼容的演示中推断奖励函数，实现成功的技能获取，并在四足机器人上测试了后空翻等技能。

Jun, 2022

GraspARL: 基于对抗强化学习的动态抓取

该研究提出了一种基于对抗式增强学习框架的动态抓取算法，通过对抗示教，使机器人可以在不同的物体运动轨迹上进行自我生成的动态抓取训练，从而实现对于动态运动物体的抓取任务的高效性和泛化能力。

Mar, 2022

基于自监督对抗模仿无标签混合动作的多用途技能控制

本文提出了一种协作对抗式学习方法，用于从包含不同状态转移模式的未标记数据集中最大化它们的可辨识度，获得可控技能集的单一多才策略。实验结果表明，借助生成式对抗模仿学习框架中的无监督技能发现，出现了成功完成任务的新颖有用技能。最后，在名为 Solo 8 的敏捷四足机器人上测试了所获得的多才多艺策略，并呈现出编码在演示中的各种不同技能的忠实复制。

Sep, 2022

通过竞争激发机器人潜力

基于竞争学习框架，通过引入竞争环境中的竞争信息作为辅助信号，可以帮助个体机器人从竞争中获取知识，充分激发其动态潜力，从而提高性能。

Mar, 2024

机器人学习的高效监督：基于模仿、仿真和自适应的方法

本研究旨在通过利用更强大的信息源和从现有数据中提取更多信息的方式，增加数据收集与维护流水线的效率，并着重解决模仿学习、领域自适应和从模拟中进行传输等三个正交方面的问题。

Apr, 2019

强韧性对抗性强化学习

提出了一种稳健性的敌对训练 (robust adversarial reinforcement learning, RARL) 方法，该方法将敌对训练与零和极小优化相结合，通过训练一个智能体，使其能够在真实系统上的杂乱因素和不确定性下操作，并在多种环境中进行了验证。

Mar, 2017

面对对手的目标条件强化学习

介绍了在存在对手的目标条件学习中，使用 DigitFlip 和 CLEVR-Play 两个新的目标条件环境，提出了用于目标条件学习的 EHER 和 CHER 两种算法，并评估了它们的性能，最终介绍了 IGOAL：一种新的目标条件学习框架。实验结果表明，将 IGOAL 与 EHER 相结合可以显著地超过现有方法，在对抗随机和能力对手时表现更好。

Nov, 2022

学习感知交互式自主安全性

为了确保机器人等自主车辆的广泛部署，本文提出了一种新的闭环范式用于综合安全控制策略，明确考虑系统在可能的未来情景下的演变不确定性，通过物理动力学和机器人的学习算法共同推理，利用对抗深度强化学习进行放大，展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。

Sep, 2023