VRL3: 基于数据驱动的视觉深度强化学习框架

Feb, 2022

VRL3: 基于数据驱动的视觉深度强化学习框架

VRL3: A Data-Driven Framework for Visual Deep Reinforcement Learning

Che Wang, Xufang Luo, Keith Ross, Dongsheng Li

TL;DR提出了 VRL3 这一数据驱动框架，在视觉深度强化学习中取得了极高的效率，并且在手部操作任务中的样本效率比先前最先进的方法高出了 780％。VRL3 在最困难的任务中样本效率提高了 1220％（使用更宽的编码器达到 2440％）并且只需 10％的计算量就能解决该任务，这些结果清楚地证明了数据驱动深度强化学习的巨大潜力。

Abstract

We propose vrl3, a powerful data-driven framework with a simple design for solving challenging visual deep reinforcement learning (DRL) ta

vrl3 data-driven framework visual deep reinforcement learning task-specific representations sample efficiency

发现论文，激发创造

视觉关系与属性检测的深度变化结构强化学习

本研究提出了一种基于深度强化学习算法的新方法 VRL，能够更好地理解场景中物体之间的相互关系和属性，并在大规模数据集上验证其优越性和预测能力。

Mar, 2017

ViSaRL：人眼显著性引导的视觉强化学习

用基于视觉显著性引导的强化学习（ViSaRL）来训练机器人从高维像素输入中执行复杂的控制任务，通过优化视觉表征，ViSaRL 显著提高了强化学习代理在不同任务上的成功率、样本效率和泛化能力。

Mar, 2024

离线视觉表示学习用于体感导航

本文提出一种名为离线视觉表示学习的方法，通过使用自监督学习在大规模图片数据上进行离线预训练，再在线微调特定任务中的视觉运动表示，并在多个数据集上进行了实验，发现该方法在图像导航和目标导航任务上均取得了显著的性能提升。

Apr, 2022

针对复杂观测的对比型变分强化学习

通过强化学习中的对比变分方法来解决视觉观测中的复杂性问题，在 Mujoco 任务和机器人推箱子任务中达到了与现有方法相当的状态，并在自然 Mujoco 任务中显著优于它们。

Aug, 2020

通过对话策略和语言生成之间的替代优化构建面向任务的视觉对话系统

本研究提出一种新的框架，可有效学习任务导向视觉对话系统的最优对话策略，并在 GuessWhich 任务中实现了最新的任务完成和对话质量表现。

Sep, 2019

视觉先见：基于模型的深度强化学习在基于视觉的机器人控制中的应用

本文提出了一种实用于实际机器人任务 -- 如机器人操作 -- 的深度强化学习算法，并在无人监督的情况下使用自我监督的基于模型的方法来训练预测模型，通过选择指定像素、目标图像或图像分类器作为目标设定方法，探索实现前所未见的任务和物体的普遍泛化。

Dec, 2018

加速强化学习的人类启发式框架

本文提出了一种基于人类启发的框架以提高采样效率，其中通过逐步提供简单但相似的任务来适应复杂的强化学习任务，并且使用任何转移学习方法来减少样本复杂性而不增加计算复杂性，实验表明该框架能够在优化问题方面表现出良好的性能。

Feb, 2023

SOLAR: 基于深度结构化表示的模型驱动强化学习

本文提出了一种适合于迭代模型增强策略，即使在具有复杂图像观测的情况下，学习简单动态和成本模型的表示方法，使得基于线性二次调节器（LQR）的基于模型的 RL 方法可用于具有图像观测的系统，并在包括通过图像直接操作真实世界机器人臂的操作中评估该方法，发现我们的方法相比其他基于模型的 RL 方法产生更好的最终性能，同时比无模型 RL 更高效。

Aug, 2018

DigiRL: 用自主的增强学习训练野外设备控制智能体

通过在开放环境中独立训练具备决策能力的视觉语言模型，这篇论文提出了一种名为 DigiRL 的新型自主强化学习方法，在控制各种设备上取得了新的最佳效果。

Jun, 2024

用于自动驾驶的虚拟到现实强化学习

本文提出了一种虚拟到现实的转换网络，使得在虚拟环境中训练的强化学习驾驶策略可在现实世界中适应，实验证明此方法效果显著且为首次成功的案例。

Apr, 2017