Jul, 2019

多智能体系统中基于最佳反应策略类型学习的收敛性和最优性

TL;DR本文提供了对于一个多智能体系统,当一个智能体需要在不事先知道其他智能体如何行动的情况下协调行动时,如何计算潜在策略的后验信念,并提出两个关键设计参数的理论指导。