Jan, 2023

一种安全的强化学习能源高效驾驶辅助系统

TL;DR本研究提出了一种基于强化学习的驾驶辅助系统,利用指数控制屏障函数过滤不安全的动作,并利用 MPO 算法计算控制动作以最大化累计奖励。研究表明,该系统可以在训练和评估过程中有效避免碰撞,并提高司机辅助系统的燃油经济性。