Jun, 2021

多智能体信任域优化的博弈论方法

TL;DR通过在策略空间中进行博弈论分析,MATRL 提出了一种用于多智能体学习的多智能体信赖域学习方法,该方法可在解决纳什均衡的元游戏级别上找到稳定的改进方向,并在离散和连续的多人游戏中明显优于基线。