MMAug, 2023

深度强化学习下的优化经济燃气轮机调度

TL;DR对于加拿大阿尔伯塔省的案例研究中,通过将西门子公司提供的热力学软件纳入环境模型,并通过模拟不确定性,如电力价格、负载和环境条件的变化,我们实施了三种常见的深度强化学习算法来处理经济型燃气轮机调度问题。在所测试的算法和基准方法中,深度 Q 网络(DQN)获得了最高的奖励,而近端策略优化(PPO)是最高效的方法。我们进一步提出并实施了一种动态分配燃气轮机运行和维护成本的方法,基于运行时间和循环数,与现有方法相比,我们的方法更好地近似了现代燃气轮机调度的真实成本,因此导致了更现实的策略。