时间变化的约束感知强化学习与能量存储控制

ICLRMay, 2024

时间变化的约束感知强化学习与能量存储控制

Time-Varying Constraint-Aware Reinforcement Learning for Energy Storage Control

Jaeik Jeong, Tai-Yeon Ku, Wan-Ki Park

TL;DR提出了一种连续强化学习方法，考虑了时间变化的可行充放电范围，通过将充放电水平限制在可行动作范围内，进一步提高了能量存储的有效利用。

Abstract

energy storage devices, such as batteries, thermal energy storages, and hydrogen systems, can help mitigate climate change by ensuring a more stable and sustainable power supply. To maximize the effectiveness of such energy storage, determining the appropriate →

energy storage reinforcement learning charging discharging feasible action range

发现论文，激发创造

使用深度强化学习控制灵活能源需求的智慧能源网络中的电池和氢能储能

本文提出了一种基于深度强化学习的多智能体控制策略，用于实时优化混合储能系统和能量需求，该系统由电池和氢能储存器组成，可以解决与电力价格、可再生能源生产和消费相关的不确定性问题，并优化使用可再生能源，降低能源成本和碳排放，提高可再生能源利用率。

Aug, 2022

多市场可再生能源优化及强化学习

该研究介绍了一种深度强化学习框架，用于优化可再生能源和储能发电厂的操作，以最大化能源市场收益，同时最小化储能损耗成本和可再生资源废弃。

Jun, 2023

学习增强的太阳能电动车充电调度

我们解决了太阳能电池板和电池配备的电动汽车（EV）的充电调度的复杂挑战，特别是在分布外（OOD）条件下。我们引入了一种新的学习增强策略，通过实时适应强化学习策略的表现来使用动态的鲁棒性预算，从而在 EV 充电调度中更有效地平衡一致性和鲁棒性，显著提高适应性和效率。

Nov, 2023

一种用于最优能量储存系统调度的约束强化深度学习框架

提出了一种利用深度强化学习和混合整数规划的框架，用于优化能量储存系统的调度决策，同时严格执行操作约束，以及在存在不确定性的环境中取得高质量的调度决策。

Jul, 2023

基于增广 Lagrangian 的深度强化学习电动汽车充电调度方法

本文旨在解决电动汽车在参与需求响应时如何优化充电 / 放电计划的问题。通过将问题建模为约束马尔可夫决策过程并采用增广拉格朗日方法和软性演员评论算法，提出了一种新的安全非同步策略优化强化学习方法，能够显著提高方案最优性和约束限制的达成。

Sep, 2022

基于规划的强化学习实现可再生能源电力系统的实时调度

该研究利用最新的强化学习算法和真实的电力网络环境，提出了一种系统的解决方案来解决传统能源调度面临的问题，并为电力系统提供了一个可持续的低碳未来。

Mar, 2023

异构电池组最优化循环的强化学习

使用基于线性函数近似的 Q 学习算法优化电池充 / 放电，考虑不同容量、斜坡、损耗和循环成本，目标是通过马尔可夫决策过程最小化电池循环中的退化成本，并设计了一类特殊的核函数以实现价值函数的结构近似。

Sep, 2021

基于深度强化学习的大规模 V2G 连续充电协调及可再生能源应用

本文提出了一种使用深度强化学习方法的车辆 - 电网技术中，对转移学习方面具有显著表现的连续充放电协调策略。该方法可以高效地优化电动汽车聚合器在实际操作条件下的实时充电 / 放电功率，与无控制充电相比，负荷变化减少了 97.37$％$，充电成本降低了 76.56$％$。

Oct, 2022

奶牛养殖中的电池管理强化学习

本研究利用 Q 学习在奶牛养殖场景中学习了一种有效的电池充放电策略，结果显示与基准算法相比，该策略显著降低了电费，突出了奶牛养殖业中强化学习在电池管理方面的有效性。

Aug, 2023

利用强化学习实现多个电动汽车充电点的计算效率协同

本文提出使用强化学习和马尔科夫决策过程 (MDP) 来协调多个电动汽车充电点，通过减少训练时间和使用线性空间和时间复杂度的新 MDP 公式，改善了业内现有技术，提高了充电需求协调达 40-50％的性能。

Mar, 2022