Jan, 2022

一种基于深度强化学习的预设狄利克雷功率分配策略

TL;DR本研究提出了用于连续分配问题的 Dirichlet 策略,在问题求解速度、性能和超参数稳健性方面比 Gaussian-softmax 策略更优。此算法被应用于需要优化高效与可持续发展的多电源系统,研究结果表明其在提高系统效率和可维护性,延长使用寿命等方面表现良好。