Re$^2$H2O: 基于反向正则化的混合离线和在线强化学习的自动驾驶场景生成

Feb, 2023

Re$^2$H2O: 基于反向正则化的混合离线和在线强化学习的自动驾驶场景生成

(Re)$^2$H2O: Autonomous Driving Scenario Generation via Reversely Regularized Hybrid Offline-and-Online Reinforcement Learning

PDF

Haoyi Niu, Kun Ren, Yizhou Xu, Ziyuan Yang, Yichen Lin...

TL;DR利用反向正则化混合离线 - 在线强化学习模型同时学习真实世界和模拟数据来生成自动驾驶测试场景，实现更高效的 AV 测试和更准确的风险评估。

Abstract

autonomous driving and its widespread adoption have long held tremendous promise. Nevertheless, without a trustworthy and thorough testing procedure, not only does the industry struggle to mass-produce autonomous vehicles (AV), but neither the general public nor policymakers are convin

autonomous driving av testing scenario generation reinforcement learning risk assessment

发现论文，激发创造

何时信任你的模拟器：动态感知的离线与在线混合增强学习

本研究提出了一个新的混合离线 - 在线强化学习范式，通过使用有限的真实数据和不受限制的模拟器探索来解决两种方法的缺陷，并在通过广泛的仿真和实际任务以及理论分析中证明了 H2O 优于其他跨域在线和离线强化学习算法，从而为解决实际的复杂任务提供了全新的思路。

Jun, 2022

基于强化学习的编辑技术生成安全关键场景

本文提出一种基于深度强化学习的生成安全关键场景的方法，通过基于生成模型的可信度目标和基于风险目标的奖励函数，成功地生成了高质量的安全关键场景。

Jun, 2023

H2O+: 混合离线和在线强化学习的改进框架与动态间隙

通过模拟和实际机器人实验，我们展示了新算法 H2O + 在跨领域在线和离线强化学习算法方面的高性能和灵活性。

Sep, 2023

基于密集强化学习的自动驾驶车辆适应性测试环境生成

通过融合多个替代模型并优化其组合系数以增强评估效率，我们开发了一种自适应测试环境，通过采用二次规划将优化问题表达为回归任务，并利用强化学习方法高效获取回归目标，实现了加速评估的效果验证。

Feb, 2024

CtRL-Sim: 反应性和可控驾驶代理的离线强化学习

在这项研究中，我们提出了一种名为 CtRL-Sim 的方法，它利用退化条件离线强化学习和物理增强的 Nocturne 模拟器，通过处理真实世界的驾驶数据来有效生成具有反应性和可控性的交通代理。我们展示了 CtRL-Sim 能够高效生成多样且逼真的安全关键场景，并提供对代理行为的精细控制。此外，我们还表明，通过用模型生成的模拟安全关键场景对模型进行微调可以增强这种可控性。

Mar, 2024

RealGen：基于检索增强生成的可控交通场景

通过检索基增强的情境学习框架 RealGen，在交通场景生成领域中实现的灵活性和可控性，为生成自动驾驶车辆训练和评估的复杂行为启发了新的方向。

Dec, 2023

FormulaZero：通过离线人口合成实现分布式鲁棒在线适应

本文针对多智能体环境下自主驾驶车辆行驶安全和效率平衡问题，提出了以自我博弈为基础的对抗生成网络和分布式鲁棒型优化方法，实验结果显示我们的方法能够在自主驾驶赛车中取得较好的性能和鲁棒性。

Mar, 2020

深度强化学习对恶劣车库场景生成的研究

自主车辆需要行驶超过 110 亿英里以确保其安全性。因此，在进行真实世界测试之前进行模拟测试的重要性是不言而喻的。近年来，以 Carla 和 CarSim 为代表的自主驾驶三维模拟器的发布，标志着自主驾驶模拟测试环境从简单的 2D 俯视图过渡到复杂的三维模型。本论文提出了一个基于深度强化学习的自动生成程序的框架，该框架可以生成不同的二维地面脚本代码，用于构建三维模型文件和地图模型文件。生成的三维地面场景在 Carla 模拟器中显示，实验者可以使用该场景进行导航算法模拟测试。

Jul, 2024

学会碰撞：一种自适应的安全关键场景生成方法

本文提出了一种基于自动生成的安全关键场景进行自动驾驶算法测试的基于生成模型的架构，并进行了针对几个不同场景的实验以证明其效率优于网格搜索或人工设计方法，并且适应性强。

Mar, 2020

用于自动驾驶的虚拟到现实强化学习

本文提出了一种虚拟到现实的转换网络，使得在虚拟环境中训练的强化学习驾驶策略可在现实世界中适应，实验证明此方法效果显著且为首次成功的案例。

Apr, 2017