MMSep, 2021

异构电池组最优化循环的强化学习

TL;DR使用基于线性函数近似的 Q 学习算法优化电池充 / 放电,考虑不同容量、斜坡、损耗和循环成本,目标是通过马尔可夫决策过程最小化电池循环中的退化成本,并设计了一类特殊的核函数以实现价值函数的结构近似。