Mar, 2022

使用强化学习进行多个电动汽车充电站需求响应协调的优化成本函数

TL;DR本研究基于强化学习模型,使用马尔可夫决策过程来协调多个充电站,通过提出改进的成本函数使得学到的控制策略始终满足不具备任何灵活性的充电需求,同时使用真实世界数据对比了两种方法在负荷平整的情况下学习强化策略的性能和策略决策的总体性能。