Jun, 2023

面向需求响应的最优定价 —— 非参数约束策略优化方法

TL;DR本文提出了一种创新的非参数约束策略优化方法,解决了基于价格的需求响应问题中,如何保证策略的稳定性和最优性的问题,并且采用一种高效的策略优化算法,得到了比现有强化学习算法更好的表现。