BriefGPT.xyz
Ask
alpha
关键词
game-theoretic principles
搜索结果 - 1
多智能体学习的通用训练方法
本文基于博弈论原理研究了一种基于人口统计的培训体系 —— 策略空间响应神谕(PSRO),并将其扩展到广义和多人游戏中。通过使用另一种解决方案概念 $\alpha$-Rank,在一些游戏分类中建立了收敛保证,并确定了 Nash 平衡和 $\a
→
PDF
5 years ago
Prev
Next