May, 2021
基于可微投影的能耗优化策略可行性约束实施
Enforcing Policy Feasibility Constraints through Differentiable Projection for Energy Optimization
Bingqing Chen, Priya Donti, Kyri Baker, J. Zico Kolter, Mario Berges
TL;DR本文提出了一种名为 PROF 的方法,可以在神经网络策略中加入可微的投影层,以满足凸运营约束,进而对能源系统的控制进行 RL 训练。我们在两个应用上进行了演示,并展示了 PROF 的性能提升。