Mar, 2025
随机网络中的多智能体Q学习动态:由于探索和稀疏性而导致的收敛
Multi-Agent Q-Learning Dynamics in Random Networks: Convergence due to
Exploration and Sparsity
TL;DR本研究解决了多智能体学习算法在多元环境中可能无法收敛到均衡解的问题,尤其是在代理数量增加时表现出的复杂非平稳行为。通过研究随机图模型下的Q学习动态,本文提出了一种新的条件,阐明了探索率、收益矩阵及网络稀疏性对智能体策略收敛的影响。在控制网络稀疏性的情况下,研究表明在多智能体系统中能够实现可靠的收敛。