深度强化学习下的优化经济燃气轮机调度

MMAug, 2023

深度强化学习下的优化经济燃气轮机调度

Optimal Economic Gas Turbine Dispatch with Deep Reinforcement Learning

Manuel Sage, Martin Staniszewski, Yaoyao Fiona Zhao

TL;DR对于加拿大阿尔伯塔省的案例研究中，通过将西门子公司提供的热力学软件纳入环境模型，并通过模拟不确定性，如电力价格、负载和环境条件的变化，我们实施了三种常见的深度强化学习算法来处理经济型燃气轮机调度问题。在所测试的算法和基准方法中，深度 Q 网络（DQN）获得了最高的奖励，而近端策略优化（PPO）是最高效的方法。我们进一步提出并实施了一种动态分配燃气轮机运行和维护成本的方法，基于运行时间和循环数，与现有方法相比，我们的方法更好地近似了现代燃气轮机调度的真实成本，因此导致了更现实的策略。

Abstract

dispatching strategies for gas turbines (GTs) are changing in modern electricity grids. A growing incorporation of intermittent renewable energy requires GTs to operate more but shorter cycles and more frequently

dispatching strategies gas turbines deep reinforcement learning (drl)dispatch problem economic gt dispatch

发现论文，激发创造

基于深度强化学习的物联网驱动智能孤岛微电网最优调度

本文使用深度强化学习技术研究了 IoT 驱动孤立微电网中柴油发电机（DG）的调度问题。旨在在可再生能源不确定性情况下充分利用可再生能源，通过离散 - 连续混合动作空间的 DRL 算法解决了二进制 DG 开关决策和连续能量调度决策，并针对旋转备用的情况提出了 POMDP 模型，实验显示其性能要优于同类算法。

Apr, 2023

基于图卷积神经网络的多智能体强化学习：电力市场发电策略的最优化竞价策略

本研究提出了一种基于 DRL 和 GCN 的分布式学习算法，使代理人能够通过从环境中获取反馈来改进投标策略并增加利润，同时将空间系统拓扑的信息输入到 GCN 中，帮助代理人了解系统结构并提高决策的准确性。在 IEEE 30-bus 系统和 IEEE 39-bus 系统的测试中表明该算法具有较好的泛化能力和更高的利润。

Aug, 2022

基于深度强化学习的微电网联合能量调度和机组启停

应用深度强化学习算法 (HAFH-DDPG)，在离网微电网中实现联合能量调度和机组启停决策来减少总发电成本，并支持简化后的行动空间。

Jun, 2022

在线建筑能量优化使用深度强化学习

本研究首次探讨使用深度强化学习在智能电网环境下实现建筑能源管理系统的在线调度优化，所提出的方法被验证可用于大规模数据资源中，如 Pecan Street Inc. 数据库，并且可以提供实时反馈以鼓励电能的更高效利用。

Jul, 2017

基于规划的强化学习实现可再生能源电力系统的实时调度

该研究利用最新的强化学习算法和真实的电力网络环境，提出了一种系统的解决方案来解决传统能源调度面临的问题，并为电力系统提供了一个可持续的低碳未来。

Mar, 2023

游戏理论深度强化学习在地理分布式数据中心中最小化 AI 推断工作负载的碳排放和能源成本

通过结合博弈论和深度强化学习的方法，本研究在地理分布的数据中心中优化 AI 推理工作负载的分配，以降低碳排放和云服务成本，同时保持性能。实验证明，该策略在减少碳排放和云服务成本方面优于现有技术，并且不会损害计算性能。这对处理不同地理位置的 AI 推理工作负载的数据中心实现可持续性和成本效益具有重要意义。

Apr, 2024

利用强化学习进行前瞻性经济调度评估

本文提出了一种基于强化学习的先行经济调度方案的评估方法，通过采用操作场景来评估强化学习代理的性能表现，使用多种性能度量指标来评估其经济效益和安全性，并通过修改的 IEEE 30 总线系统进行仿真和对比实验，结果表明该方法适应不同环境的表现良好。

Sep, 2022

考虑终端用户灵活性的电动汽车充电的最优调度

使用深度强化学习（特别是深度 Q 网络）确定户用电动汽车的成本减少充电策略，该策略可为终端用户节约超过 20% 的电费开支。

Oct, 2023

基于模型的深度强化学习电压控制策略高效学习

提出了一种基于模型的深度强化学习方法，用于设计短期电压稳定性问题的紧急控制策略，并使用基于深度神经网络的动态代理模型进行训练，最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。

Dec, 2022

基于深度策略梯度方法的商品交易

深度强化学习方法在算法性商品交易中的有效性进行了研究，提出了一种新的离散化方案，通过优化交易成本和风险敏感的交易代理来提高 DRL 模型的性能，并且该模型在天然气期货交易中表现出较高的夏普比率及一定的风险自定义能力。

Aug, 2023