电厂监控的安全强化学习算法

Jan, 2024

A Safe Reinforcement Learning Algorithm for Supervisory Control of Power Plants

Yixuan Sun, Sami Khairy, Richard B. Vilim, Rui Hu, Akshay J. Dave

TL;DR我们提出了基于近端策略优化的概率约束强化学习算法，通过使用 Lagrangian relaxation 将约束优化问题转换为无约束目标，从而在先进的核电厂设计中实现了最小违规距离和违规率。

Abstract

Traditional control theory-based methods require tailored engineering for each system and constant fine-tuning. In power plant control, one often needs to obtain a precise representation of the system dynamics an

control theory-based methods power plant control reinforcement learning state constraints nuclear power plant design

发现论文，激发创造

基于已知约束函数的多能源管理系统安全强化学习

本文提出了两种新的安全强化学习方法，即 SafeFallback 和 GiveSafe，其安全约束公式与 RL 公式分离，可提供硬约束满足保证，且无需解决数学问题，从而降低计算能力要求，并具有更灵活的约束公式表述。方法可应用于超出 RL 的任何策略，同时提供硬约束保证，并在模拟多能源系统案例研究中验证了方法的有效性。

Jul, 2022

使用对抗训练提高强化学习在电力系统控制中的鲁棒性

本文针对电网控制系统的弱点进行研究，发现现有的强化学习算法存在敏感性，容易受到恶意攻击，提出了一种基于对抗训练的解决方案，以增强算法的安全性和鲁棒性。

Oct, 2021

基于动作集的安全电网管理策略优化

本文提出了一种基于搜索规划算法的新方法解决强化学习中存在的环境约束问题，同时采用黑盒策略优化的进化策略来训练策略直接优化。在 NeurIPS L2RPN 竞赛中，我们的解决方案在两个轨道中均名列第一，能够有效管理电网并确保其地安全性。

Jun, 2021

基于模型的深度强化学习电压控制策略高效学习

提出了一种基于模型的深度强化学习方法，用于设计短期电压稳定性问题的紧急控制策略，并使用基于深度神经网络的动态代理模型进行训练，最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。

Dec, 2022

带安全强化学习的应急情况受限经济调度

在未来的电力系统中，将大量依赖于具有高比例的分散式可再生能源和能量存储系统的微电网。出于复杂性和不确定性的原因，在这种情境下的传统能源调度策略可能不可行，利用基于强化学习的控制器可以解决这一挑战，但不能提供安全保障，于是我们提出了一种经过正式验证的基于强化学习的经济调度控制器，来克服这种局限性。

May, 2022

基于规划的强化学习实现可再生能源电力系统的实时调度

该研究利用最新的强化学习算法和真实的电力网络环境，提出了一种系统的解决方案来解决传统能源调度面临的问题，并为电力系统提供了一个可持续的低碳未来。

Mar, 2023

多能源管理系统的自我完善硬约束条件下安全的强化学习

本文介绍了两项新的安全强化学习方法，OptLayerPolicy 和 self-improving hard constraints，将约束函数与 RL 形式解耦，以提高初始效用和准确性，提供了在模拟的多能源系统案例研究中实现 92.4%（OptLayerPolicy）的初始效用和 104.9%（GreyOptLayerPolicy）的策略的结果。

Apr, 2023

核电站燃料优化的强化学习算法评估

本研究致力于通过使用深度强化学习中的近端策略优化算法，研究多重约束下核燃料 loading pattern 的最佳优化方法，并通过实验结果展示其优越性。

May, 2023

具有稳定性保证的安全基于模型的强化学习

该论文提出了一种考虑安全性的学习算法，利用 Lyapunov 稳定性检验的控制理论结果和动力学统计模型，得到具备可证明稳定性证书的高性能控制策略，并通过高斯过程先验进一步保证数据安全性和提高控制性能。在反演摆模拟实验中表现出安全性高、控制性能良好的特点。

May, 2017

安全约束的多智能体强化学习在主动电压控制中的应用

基于多智能体强化学习的安全限制算法，用于解决分布式可控发电机在电力网络中主动电压控制问题，通过在电力分布网络模拟环境中进行实验，证明了该方法与最新的多智能体强化学习方法相比的有效性。

May, 2024