ICLRMay, 2024

时间变化的约束感知强化学习与能量存储控制

TL;DR提出了一种连续强化学习方法,考虑了时间变化的可行充放电范围,通过将充放电水平限制在可行动作范围内,进一步提高了能量存储的有效利用。