Jun, 2015

随机团队与博弈的去中心化 Q-Learning

TL;DR本文介绍了用于随机动态团队和游戏的分散 Q 学习算法,研究了其在包括团队问题在内的弱无环情况下的收敛性。