May, 2020

主动配电网络基于变频器的电压 - 无功控制的两阶段深度强化学习

TL;DR使用两阶段深度强化学习方法来优化基于逆变器能源的电压调节,通过一个高效的对抗性强化学习算法,训练出离线代理程序,然后将其安全地转移到在线代理程序中,在线学习和控制具有显著的安全性和效率,从而比现有机器学习方法取得更好性能。