基于注意力机制的深度强化学习在多视角环境中的应用

May, 2019

基于注意力机制的深度强化学习在多视角环境中的应用

Attention-based Deep Reinforcement Learning for Multi-view Environments

Elaheh Barati, Xuewen Chen, Zichun Zhong

TL;DR研究了多视角环境下的深度强化学习问题，并提出基于注意力机制的方法以学习动态关注环境中不同视角的重要性以促进决策制定和复杂策略的学习。在 TORCS 赛车模拟器和三个其他带有障碍物的复杂 3D 环境上验证了该方法的有效性。

Abstract

In reinforcement learning algorithms, it is a common practice to account for only a single view of the environment to make the desired decisions; however, utilizing multiple views of the environment can help to promote the learning of complicated policies. Since the views may frequentl

reinforcement learning multi-view environment attention-based method policy learning decision-making

发现论文，激发创造

多视角环境下深度强化学习的演员 - 评论家 - 注意力机制

本文提出了一种基于深度强化学习和注意力机制的多视角环境下的模型，能够学习一个能够根据每个视角的重要性来动态决策的策略，实验结果表明在各种复杂环境中都表现出色。

Jul, 2019

多视角强化学习

本文介绍了多视角强化学习（MVRL）模型，通过观察模型来解决决策问题，提出了两种求解方法：观察扩展和跨角度策略转移，实验证明这两种方法在处理多视角环境中具有较好的性能，减少样本复杂度和计算时间。

Oct, 2019

多智能体强化学习的演员 - 注意力 - 评论家模型

提出了一个基于 Actor-Critic 算法的多智能体强化学习算法，解决了多智能体场景下的信息筛选问题，可应用于大多数多智能体学习问题。

Oct, 2018

深度无模型强化学习中的感知学习

本文提出了一个用于强化学习（RL）的新型无模型代理人，从视觉关注和主动感知的概念中受到启发，将人类注意力机制应用于代理人，创建了一种硬式关注机制，结合了 RAM 模型和 PPO 算法，在两个 Atari 游戏中比较其性能，结果表明我们的模型能够匹配 PPO+LSTM 的表现。

Jan, 2023

多视角梦境：对比学习的多视角世界模型

本文提出了一个新的强化学习代理，Multi-View Dreaming，用于从多视角观测中进行综合识别和控制。我们使用对比学习来训练不同视角之间的共享潜在空间，并展示了如何使用专家产品方法来集成和控制多个视角的概率分布的潜在状态。我们还提出了 Multi-View DreamingV2，它使用分类分布来建模潜在状态，并证明该方法在实际机器人控制任务中优于现有方法的简单扩展。

Mar, 2022

深度强化学习自动驾驶决策的揭秘

自适应驾驶决策中，深度强化学习模型的黑盒特性限制了实际应用，因此本研究工作关注一种基于注意力机制的可解释深度强化学习框架，并使用连续近端策略优化算法作为基准模型，在开源自适应驾驶仿真环境中加入了多头注意力机制。通过分析技术讨论模型的可解释性和因果关系，发现模型的第一个头部编码了邻近车辆的位置，而第二个头部则专注于领导车辆。此外，自车的动作在时空上受到目标车道上车辆的因果依赖。这些发现可帮助从业人员解读深度强化学习算法的结果。

Mar, 2024

注意力多任务深度强化学习

本文提出了一种基于注意力机制的多任务深度强化学习方法，该方法可以自动将任务知识分组，并在可能的情况下实现积极的知识转移，避免任务干扰，并表现出可比较或优越的性能。

Jul, 2019

多相机强化学习的多视角解缠

使用多个摄像机同时进行训练，以及利用多个摄像机的不同视角信息来提高增强学习的性能，我们提出了一种名为多视图解缠（MVD）的方法，通过学习来自多个摄像机的策略以实现对训练集中任意单个摄像机的无需示范泛化能力。

Apr, 2024

视觉注意力下的多对象识别

提出使用基于注意力模型的深度循环神经网络，加上强化学习训练，以识别并定位输入图像中的多个目标。通过在谷歌街景图像中转录房屋编号序列的挑战性任务上的测试，表明该模型精度高于现有最先进的卷积神经网络，且使用的参数和计算量较少。

Dec, 2014

增强式关注机制用于小样本学习及其扩展

本文提出了一种利用加强学习技术对注意力机制调整的方法来生成更优选择的图像嵌入向量，从而有效提高几类学习和图像分类的性能。

Apr, 2021