Sep, 2022

基于增广Lagrangian的深度强化学习电动汽车充电调度方法

TL;DR本文旨在解决电动汽车在参与需求响应时如何优化充电/放电计划的问题。通过将问题建模为约束马尔可夫决策过程并采用增广拉格朗日方法和软性演员评论算法,提出了一种新的安全非同步策略优化强化学习方法,能够显著提高方案最优性和约束限制的达成。