一种安全的强化学习能源高效驾驶辅助系统

Jan, 2023

一种安全的强化学习能源高效驾驶辅助系统

Safe Reinforcement Learning for an Energy-Efficient Driver Assistance System

Habtamu Hailemichael, Beshah Ayalew, Lindsey Kerbel, Andrej Ivanco, Keith Loiselle

TL;DR本研究提出了一种基于强化学习的驾驶辅助系统，利用指数控制屏障函数过滤不安全的动作，并利用 MPO 算法计算控制动作以最大化累计奖励。研究表明，该系统可以在训练和评估过程中有效避免碰撞，并提高司机辅助系统的燃油经济性。

Abstract

reinforcement learning (RL)-based driver assistance systems seek to improve fuel consumption via continual improvement of powertrain control actions considering experiential data from the field. However, the need

reinforcement learning driver assistance systems exponential control barrier function maximum a posteriori policy optimization vehicle control

发现论文，激发创造

联网自动化混合动力车环保驾驶的安全基于模型的离线策略强化学习

本研究探讨将 Safe Off-policy Model-Based Reinforcement Learning 算法应用于连接的自动化混合动力车辆的生态驾驶问题。结果表明，在模拟实验中，该算法表现出更高的平均速度和更好的节能效果，与基线控制器相比，其减少了超过 21% 的燃料消耗，同时保持了可比的平均速度。

May, 2021

深度强化学习实现驾驶援助生态驾驶和传动控制

本文提出了针对现代交通运输领域中节约能源消耗和减少温室气体排放的需求，采用深度强化学习控制体方法，模拟实现了可交互的节油驾驶辅助代理，以最小化油耗为目标，并通过与基准控制器性能的比较，验证了该代理策略的有效性。

Dec, 2022

使用概率控制障碍函数进行安全强化学习以实现匝道合并

控制屏障函数嵌入强化学习策略中，使用概率控制屏障函数作为模型不确定性的估计，实现了安全而高效的自动驾驶算法，可以应用于高速公路匝道合并问题。

Dec, 2022

基于障碍函数的端到端安全强化学习在安全关键型连续控制任务中的应用

本文提出了一种控制器架构，该架构将模型自由的强化学习控制器与利用控制屏障函数和未知系统动态的模型控制器相结合，以确保学习过程中的安全，并利用高斯过程对系统动态进行建模和不确定性分析。

Mar, 2019

基于已知约束函数的多能源管理系统安全强化学习

本文提出了两种新的安全强化学习方法，即 SafeFallback 和 GiveSafe，其安全约束公式与 RL 公式分离，可提供硬约束满足保证，且无需解决数学问题，从而降低计算能力要求，并具有更灵活的约束公式表述。方法可应用于超出 RL 的任何策略，同时提供硬约束保证，并在模拟多能源系统案例研究中验证了方法的有效性。

Jul, 2022

动力总成控制的残差策略学习

本文介绍一种主动驾驶辅助方法，使用剩余策略学习代理人来提供剩余操作以平衡燃料消耗和其他驾驶员适应性目标。通过实施在各种车辆尾随情境下的模拟商用车上，我们发现与基线源策略相比，剩余策略学习代理人很快学习到了显着改进的策略，但在某些方面不如从头开始训练的强化学习代理人所能达到的最终结果。

Dec, 2022

参数化强化学习方法在信号控制路口电动车辆节能驾驶中的应用

本文提出一种基于强化学习的连接电动汽车经济驾驶框架，旨在提高车辆能源效率，并在交通信号灯路口中重新定义汽车后续策略、换道策略以及车辆加速控制决策，从而优化车辆动作方案，基于 SUMO 软件单车视角和流量视角的评估表明，该策略能够显著减少非人为驾驶车辆的能源消耗，实现了减排目的。

Jun, 2022

基于强化学习的自动驾驶安全、高效、舒适速度控制

该论文基于深度强化学习提出了一种用于汽车跟随速度控制的模型，通过对车辆速度的控制以最大化累积奖励，实现安全、高效和舒适的车跟随行为，并与实际数据进行了对比，结果表明强化学习方法在无人驾驶系统开发方面具有潜在的贡献。

Jan, 2019

基于强化学习的自我改进安全驾驶性能与黑盒验证算法

提出了一种自我完善的人工智能系统，通过黑盒验证方法，增强基于强化学习的自主驾驶代理的安全性能。在发现自动驾驶失败情况后，RL 代理的训练通过迁移学习重新初始化，以改善先前不安全的情况的表现

Oct, 2022

自主高速公路驾驶增强安全的深度强化学习

本文提出了一种安全的深度强化学习自动驾驶系统，采用了基于规则和基于学习的方法，其中包括手工制作的安全模块和动态学习的安全模块，通过模拟环境的实验结果证明了其优异的性能。

Oct, 2019