Feb, 2022

基于数据驱动的需求响应在线互动竞标策略

TL;DR本文提出一种使用智能电表数据和功能,同时确定投标和购买策略,基于历史招标经验学习的双代理深度确定性策略梯度方法来优化招标和购买决策,并通过在线学习确保趋势跟踪和自适应,结果表明该模型可以通过离线 / 在线学习投标规则并稳健地进行适当的出价,在面对多种情况时获得最优利润。