由特权到预测：面向城市驾驶的感觉动作强化学习

Sep, 2023

由特权到预测：面向城市驾驶的感觉动作强化学习

Privileged to Predicted: Towards Sensorimotor Reinforcement Learning for Urban Driving

Ege Onat Özsüer, Barış Akgün, Fatma Güney

TL;DR通过深度学习模型，我们研究了特权强化学习代理和感知运动代理在城市驾驶中的差异，以缩小二者之间的差距，并提出了逐步发展较不特权的强化学习代理的解决方案。我们还观察到离线数据集上训练的鸟瞰图模型在在线强化学习训练中存在分布不匹配的问题。通过在 CARLA 模拟环境中进行严格评估，我们揭示了强化学习中状态表示对自动驾驶的重要性，并指出了未解决的研究挑战。

Abstract

reinforcement learning (RL) has the potential to surpass human performance in driving without needing any expert supervision. Despite its promise, the state-of-the-art in sensorimotor self-→

reinforcement learning driving sensorimotor self-driving privileged representations state representations

发现论文，激发创造

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

基于隐含机会的城市驾驶端到端无模型强化学习

本文采用一种叫 implicit affordances 的新技术，成功地通过强化学习算法完成了诸如车道保持，行人和车辆避让，以及红绿灯检测等复杂任务，最终在 CARLA 挑战赛中获胜。

Nov, 2019

城市环境下驾驶的有条件能力学习

该研究提出了一种基于直接感知的自主驾驶方法，在城市环境中能够根据高级方向输入进行自主导航，同时能够识别交通信号灯和速度标志，降低车辆事故率。

Jun, 2018

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023

教练可教学生

通过知识蒸馏和模仿学习，教授一个机载学生代理人在 CARLA 中学会驾驶

Jun, 2023

通过模仿强化学习教练实现端到端城市驾驶

通过强化学习教练，我们的端到端自主驾驶智能体实现了与人类专家水平接近的表现，其能够通过鸟瞰图像实现连续的低级别操作，提供可靠的监督信号，从而在 NoCrash-dense 基准测试和 CARLA LeaderBoard 公共路线方面达到了最先进的性能。

Aug, 2021

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

基于参数化技能和先验知识的自动驾驶高效强化学习

ASAP-RL 提出了一种基于动作技能和专家先验知识的自动驾驶高效强化学习算法，旨在应对在复杂的拥堵道路条件下，传统驾驶策略难以扩展的问题。实验结果表明，相对于其他应用不同技能和先验知识的方法，该算法能够提高学习效率和驾驶性能。

May, 2023

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022