Jan, 2019

一般化递归推理模型下多智体互动中的有界理性建模

TL;DR本文提出了一种广义的递归推理(GR2)框架,旨在建模具有不同分层次理性的代理,其架构能够使代理表现出不同层次的 “思考” 能力,使得上层代理可以更好地应对各种不那么复杂的学习者。我们在理论和实验方面都有贡献,首先在理论方面,通过概率图模型设计了 GR2 的分层架构,并证明了完美贝叶斯均衡存在。其次,在实证方面,我们在多种 MARL 基准测试中验证了我们的发现,证明了我们提出的方法在效果上具有巨大的优势。