Sep, 2024

有限空间均值场型博弈的强化学习

TL;DR本研究解决了均值场型博弈在计算方法上的不足,特别是在大规模背景下的有效性和可扩展性问题。作者提出了两种强化学习算法,其中一种基于均值场空间的量化和Nash Q学习,另一种是深度强化学习算法,能够适应更大的空间。实验结果表明所提方法在多个环境中具备良好的可扩展性和效率。