Mar, 2024

混合动力车的受约束最优燃料消耗:受约束强化学习方法

TL;DR混合动力汽车是越来越受欢迎,因为它们可以更好地结合内燃机和电动机的工作特性。本文首次从有限增强学习的角度提供了有限约束优化燃料消耗(COFC)的数学表达式,并首次利用有限变分策略优化(CVPO)和基于 Lagrange 方法的有限方法来获得混合动力汽车在电池电力平衡条件下的最小燃料消耗。通过对著名的 Prius TOYOTA 混合动力系统(THS)在 NEDC 条件下进行案例研究,我们得出了实施 CRL 方法的关键步骤,并比较了 CVPO 和基于 Lagrange 方法之间的性能。我们的案例研究发现 CVPO 和基于 Lagrange 方法在保持 SOC 平衡约束的同时可以获得最低燃料消耗,其中 CVPO 方法收敛稳定,而基于 Lagrange 方法可以获得最低燃料消耗为 3.95 升 / 百公里,尽管有更明显的振荡。这个结果验证了我们提出的 CRL 方法对 COFC 问题的有效性。