交互式自主导航与内部状态推断及交互度估计

Nov, 2023

交互式自主导航与内部状态推断及交互度估计

Interactive Autonomous Navigation with Internal State Inference and Interactivity Estimation

Jiachen Li, David Isele, Kanghoon Lee, Jinkyoo Park, Kikuo Fujimura...

TL;DR通过引入空间 - 时间相关推理等辅助任务，将深度强化学习框架与神经网络结合，以提高智能代理（如自动驾驶车辆）在复杂场景中的决策性能和可解释性。首次通过推理和预测他人行为，确定他们对自身行为的影响程度，提供了详尽的中间指标用于决策制定。

Abstract

deep reinforcement learning (DRL) provides a promising way for intelligent agents (e.g., autonomous vehicles) to learn to navigate complex scenarios. However, DRL with neural networks as function approximators is typically considered a black box with little explainability and often suf

deep reinforcement learning autonomous navigation spatio-temporal relational reasoning auxiliary tasks interactivity estimation

发现论文，激发创造

利用潜在状态推断和时空关系实现自主驾驶的强化学习

本文介绍了利用深度强化学习和图神经网络，结合编码潜在状态和空间 - 时间关系的方法解决自动驾驶场景下规避横穿车辆的难点，实现了显著性能提升。

Nov, 2020

深度强化学习自动驾驶决策的揭秘

自适应驾驶决策中，深度强化学习模型的黑盒特性限制了实际应用，因此本研究工作关注一种基于注意力机制的可解释深度强化学习框架，并使用连续近端策略优化算法作为基准模型，在开源自适应驾驶仿真环境中加入了多头注意力机制。通过分析技术讨论模型的可解释性和因果关系，发现模型的第一个头部编码了邻近车辆的位置，而第二个头部则专注于领导车辆。此外，自车的动作在时空上受到目标车道上车辆的因果依赖。这些发现可帮助从业人员解读深度强化学习算法的结果。

Mar, 2024

基于图卷积的深度强化学习在混合交通环境下的多智能体决策

本研究提出了一种利用图神经网络和深度强化学习相结合的图强化学习方法，以提高自主车辆互动交通场景下的决策生成精度。在实验验证中，该方法能够提取交互情景特征，并生成更好的合作行为。

Jan, 2022

安全导航：在 CARLA 中使用深度强化学习进行自主车辆训练

自主驾驶汽车使用深度强化学习技术在不确定环境中进行决策，通过使用 CARLA 模拟器在真实城市环境中训练和测试自动驾驶模型，实现了准确的对象识别和距离估计以及有效的交通导航。

Oct, 2023

使用逆强化学习和深度 Q 网络进行驾驶学习

提出一种使用深度 Q 网络进行逆向强化学习 (IRL) 来提取大状态空间问题中奖励的方法，并在基于模拟的自主驾驶场景中评估其性能。结果表明，经过几次学习后，模拟代理能够生成无碰撞的运动，并表现出人类般的变道行为。

Dec, 2016

DRNet：基于深度强化学习的自动车道变更决策方法

机器学习在自主驾驶车辆的决策制定中优于许多基于规则的方法，我们通过提出一种基于强化学习的框架 'DRNet'，使用深度强化学习 (DRL) 来改进车道切换，并结合安全验证来确保只选择安全动作。

Nov, 2023

关系深度强化学习

通过结构化感知和关系推理的方法，使用自我注意力来进行实体之间关系的迭代推理以及指导无模型策略的建立，提高了强化学习的效率、泛化能力和可解释性，并在 Box-World 任务和 StarCraft II Learning Environment 等方面取得了一定的进展。

Jun, 2018

多智能体动态关系推理在社交机器人导航中的应用

通过系统的关系推理方法和轨迹预测，我们提出了一种适用于多智能体系统的社交机器人导航研究，通过该方法，在密集、互动场景中，在安全性、效率性和社交遵循性方面显著优于最强基准线。

Jan, 2024

使用深度强化学习的自主驾驶顺序决策的分层体系结构

本研究开发了一个多模态架构，包括自我周围环境的建模，并训练了一个深度强化学习代理，以在随机高速公路驾驶场景中实现一致的性能，将自主驾驶问题分成多层控制结构使我们能够将 AI 的能力分别用于解决每一层，最终实现更可靠的系统，可在实际的自动驾驶汽车中实现。

Jun, 2019

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023