Jun, 2023
面向需求响应的最优定价 —— 非参数约束策略优化方法
Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization Approach
Jun Song, Chaoyue Zhao
TL;DR本文提出了一种创新的非参数约束策略优化方法,解决了基于价格的需求响应问题中,如何保证策略的稳定性和最优性的问题,并且采用一种高效的策略优化算法,得到了比现有强化学习算法更好的表现。