Oct, 2023

基于深度强化学习的智能交通信号控制与CO2排放优化

TL;DR该研究报告介绍了一种名为EcoLight的奖励塑造方案,用于强化学习算法中,既可以减少二氧化碳排放,又可以在诸如旅行时间之类的指标上获得具有竞争力的结果。该研究比较了采用表格型Q学习、DQN、SARSA和A2C算法的性能,使用的指标包括旅行时间、二氧化碳排放、等待时间和停车时间,考虑了多种道路使用者(卡车、公交车、汽车)和不同污染水平的多个场景。