Sep, 2018

大规模多智能体系统的分解 Q 学习

TL;DR本文针对多智能体场景下动态和智能体之间的复杂性引起的动作空间爆炸问题,提出将 Q 函数近似为分解成对交互的高阶高维张量,并利用复合深度神经网络实现计算,借此简化模型,加快学习过程,通过在多个场景上的实验得出,该方法表现良好。