Feb, 2024

基于 Shapley 值的多智能体强化学习:理论、方法及其在能源网络中的应用

TL;DR本论文通过合作博弈理论研究了多智能体强化学习中的信用分配问题,提出了一种基于 Markov Shapley 值的信用分配方案,并应用于能源网络的真实问题上。