GRIMGEP: 视觉深度强化学习中鲁棒目标采样的进展学习

Aug, 2020

GRIMGEP: 视觉深度强化学习中鲁棒目标采样的进展学习

GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning

Grgur Kovač, Adrien Laversanne-Finot, Pierre-Yves Oudeyer

TL;DR提出了一种框架，可以使代理能够自主识别和忽略干扰区域，从而在可学习区域中寻找新颖性，改善整体表现并避免灾难性遗忘。实验表明，代理利用该框架成功地识别了环境的有趣区域，并在性能上取得了极大的改善。

Abstract

Designing agents, capable of learning autonomously a wide range of skills is critical in order to increase the scope of reinforcement learning. It will both increase the diversity of learned skills and reduce the burden of manually designing reward functions for each skill. self-supervised ag

autonomous learning self-supervised agents image-based exploration goal identification performance improvement

发现论文，激发创造

想象目标的视觉强化学习

介绍了一种通过结合无监督表示学习和强化学习来获得一般技能库的算法，可以处理原始感官输入（如图像），并使用后期目标重新标记方案来进一步提高其方法的样本效率，在实际机器人系统上获得了比之前的技术更好的效果。

Jul, 2018

基于无监督学习的目标领域非赏值驱动探索

本研究提出使用深度表示学习算法学习目标空间的方法，通过此方法可以发现探索算法，与工程化表示法相比性能表现相匹配。

Mar, 2018

通过价值分歧进行自动课程学习

通过提出自动课程设计和目标建议模块，来提高强化学习中的多任务目标采样效率，并在机器人和导航任务中展示了比现有方法更好的性能。

Jun, 2020

学习去耦合目标空间的好奇心驱动探索

本文介绍了如何使用内在动机和深度学习算法来有效生成目标空间，提出了使用解耦目标空间可以更好地进行探索，同时利用模块化学习进度驱动求知型探索，同时发现了环境的独立可控特征。

Jul, 2018

视觉先见：基于模型的深度强化学习在基于视觉的机器人控制中的应用

本文提出了一种实用于实际机器人任务 -- 如机器人操作 -- 的深度强化学习算法，并在无人监督的情况下使用自我监督的基于模型的方法来训练预测模型，通过选择指定像素、目标图像或图像分类器作为目标设定方法，探索实现前所未见的任务和物体的普遍泛化。

Dec, 2018

基于情境的自监督机器人学习中的虚拟目标

研究了机器人如何通过无监督学习和条件目标设定模型自主地学习和实践行为，从而掌握丰富的技能和处理不同的任务和环境。

Oct, 2019

自定学习进度作为规则化学习课程的方法

通过自带课程学习和基于自适应学习的绝对学习进度正则化方法，加速强化学习的计算，提高其效率。

Jun, 2023

通过修剪原型目标扩展目标导向探索的规模

本研究基于强化学习，通过在人工设计产生的广泛目标空间中寻找可控、可达、新颖和相关目标的自主发现过程，弥补探索广域领域中新奇性和涵盖性行为不足的问题，并在三种具有挑战性的环境中证明了目标导向的探索的有效性。

Feb, 2023

无任务特定知识的自主强化学习自我监督课程生成

提出了一种新颖的自主强化学习算法，能够根据智能体的学习进展生成自适应课程，使智能体能够高效地解决稀疏奖励迷宫导航任务，同时减少了手动复位。

Nov, 2023

利用弱标记图像推广基于视觉的机器人技能

研究了机器人感知运动控制策略的广义学习问题，提出了一种称为 GPLAC 的方法来提高机器人策略的泛化能力，结合多任务学习和辅助二进制分类目标，通过卷积神经网络和注意力机制，将交互数据与弱标记的数据集相结合，大大提高了对未知环境的泛化能力。

Aug, 2017