Apr, 2022

随机博弈中的马尔科夫均衡复杂性

TL;DR本文研究了 Markov 粗粒度关联均衡问题的计算复杂性及其在多智能体强化学习中的应用,发现当多智能体交互为回合制、折扣因子和粗略程度为常数时,计算近似的 Markov 粗粒度关联均衡策略属于 NP 难问题,但是提供了在多智能体中非稳定 Markov CCE 策略的学习解决方案。