混合动力车的受约束最优燃料消耗：受约束强化学习方法

Mar, 2024

混合动力车的受约束最优燃料消耗：受约束强化学习方法

Constrained Optimal Fuel Consumption of HEV: A Constrained Reinforcement Learning Approach

Shuchang Yan

TL;DR混合动力汽车是越来越受欢迎，因为它们可以更好地结合内燃机和电动机的工作特性。本文首次从有限增强学习的角度提供了有限约束优化燃料消耗（COFC）的数学表达式，并首次利用有限变分策略优化（CVPO）和基于 Lagrange 方法的有限方法来获得混合动力汽车在电池电力平衡条件下的最小燃料消耗。通过对著名的 Prius TOYOTA 混合动力系统（THS）在 NEDC 条件下进行案例研究，我们得出了实施 CRL 方法的关键步骤，并比较了 CVPO 和基于 Lagrange 方法之间的性能。我们的案例研究发现 CVPO 和基于 Lagrange 方法在保持 SOC 平衡约束的同时可以获得最低燃料消耗，其中 CVPO 方法收敛稳定，而基于 Lagrange 方法可以获得最低燃料消耗为 3.95 升 / 百公里，尽管有更明显的振荡。这个结果验证了我们提出的 CRL 方法对 COFC 问题的有效性。

Abstract

hybrid electric vehicles (HEVs) are becoming increasingly popular because they can better combine the working characteristics of internal combustion engines and electric motors. However, the minimum fuel consumption

hybrid electric vehicles fuel consumption constrained optimal fuel consumption constrained reinforcement learning lagrangian-based approaches

发现论文，激发创造

插电式混合动力汽车的数据驱动建模和监控系统优化

基于学习的智能能源管理系统对于插电式混合动力电动汽车 (PHEVs) 的高效能源利用至关重要，然而，其应用在现实世界中面临着系统可靠性的挑战，这阻碍了原始设备制造商 (OEMs) 的广泛接受。本文通过建立基于物理和数据驱动模型的 PHEV 模型，聚焦于高保真度训练环境，并提出一个以真实车辆应用为导向的控制框架，将基于扩展时间尺度的强化学习 (RL) 能源管理与等价耗电量最小化策略 (ECMS) 相结合，以提高实际适用性，同时改善现有研究中基于瞬时驾驶循环和动力系统状态的等效因素评估方法的缺陷。最后，进行全面的仿真和硬件在环验证，证明了所提出的控制框架在燃油经济性方面相对于自适应 ECMS 和基于规则的策略的优势。与直接控制动力系统组件的传统 RL 架构相比，所提出的控制方法不仅能实现类似的最优性，而且还显著提高了能源管理系统的干扰抗性，在 OEMs 的真实车辆应用中提供了一种有效的基于 RL 的能源管理策略的控制框架。

Jun, 2024

连接式混合动力电动车能量管理的最新进展

混合动力电动汽车的能源管理系统、连接的混合动力电动汽车的协同驾驶控制和强化学习是未来可持续交通系统的关键挑战和解决方案。

Aug, 2023

基于增广 Lagrangian 的深度强化学习电动汽车充电调度方法

本文旨在解决电动汽车在参与需求响应时如何优化充电 / 放电计划的问题。通过将问题建模为约束马尔可夫决策过程并采用增广拉格朗日方法和软性演员评论算法，提出了一种新的安全非同步策略优化强化学习方法，能够显著提高方案最优性和约束限制的达成。

Sep, 2022

基于强化学习的混合动力汽车最优能量管理策略探究

本文提出了一种新型框架，以在 FASTSim 开源车辆仿真工具中实现基于强化学习的能量管理策略，并在不同测试驾驶周期下对不同的车型进行评估，证明了这些基于强化学习的能量管理策略在提高能源效率方面的有效性。

May, 2023

基于自适应模拟退火和强化学习的电动车容量路径问题新超启发式

本研究提出了一种称为 HHASA_{RL} 的超启发式方法来解决容量限制电动车路线问题，该问题包含了电动车的充电站数量有限以及行驶范围的限制，这种方法通过将多臂赌博机方法和自适应模拟退火算法相结合，以改进已有的解决方案并在 IEEE WCCI2020 竞赛中获得最佳平均值。

Jun, 2022

自学习模糊强化学习的燃料电池混合动力车寿命延长的能量管理策略

本文提出了一种基于模糊强化学习的能量管理策略，以减少燃料消耗，维护电池的长期运行和延长燃料电池系统的使用寿命。通过考虑惩罚函数抑制燃料电池的频繁启动，应用模糊逻辑来近似 Q 学习中的价值函数，解决了连续状态和操作空间的问题。最终，基于 Python 的培训和测试平台验证了该方法的有效性和自学习改进，在初始状态变化、模型变化和驾驶条件变化的情况下。

Feb, 2023

电动汽车车辆 - 网格供应路线问题的强化学习方法

本研究基于强化学习算法，从车辆装载容量、时间窗口、能量供应等多个因素出发，在大规模客户和配电站环境下，构建了满足多个系统目标的电动车路由模型，并通过实验证明，该方法不但在速度上快于混合整数线性规划和遗传算法元启发式算法，而且结果质量接近最优解。

Apr, 2022

联网自动化混合动力车环保驾驶的安全基于模型的离线策略强化学习

本研究探讨将 Safe Off-policy Model-Based Reinforcement Learning 算法应用于连接的自动化混合动力车辆的生态驾驶问题。结果表明，在模拟实验中，该算法表现出更高的平均速度和更好的节能效果，与基线控制器相比，其减少了超过 21% 的燃料消耗，同时保持了可比的平均速度。

May, 2021

参数化强化学习方法在信号控制路口电动车辆节能驾驶中的应用

本文提出一种基于强化学习的连接电动汽车经济驾驶框架，旨在提高车辆能源效率，并在交通信号灯路口中重新定义汽车后续策略、换道策略以及车辆加速控制决策，从而优化车辆动作方案，基于 SUMO 软件单车视角和流量视角的评估表明，该策略能够显著减少非人为驾驶车辆的能源消耗，实现了减排目的。

Jun, 2022

利用多目标哈里斯雀优化进行电动车协调以实现电网平衡

本文提出了一种适用于日前期望保证可靠能量供应和维持稳定局部电网的 EV 车队协调模型，利用 EV 来储存多余能量，并在能量不足时释放，结果表明，EV 的协调充电和放电不仅满足平衡服务要求，还与用户偏好基本吻合。

Nov, 2023