BriefGPT.xyz
Ask
alpha
关键词
psro
搜索结果 - 3
IJCAI
自适应的 PSRO:走向一种自动基于人口的游戏求解器
通过使用 Transformer 架构,我们提出了一种自适应超参数选择的参数化策略空间响应预言机(PSRO)方法,该方法在各种双人零和游戏中展现出优越的性能。
PDF
3 months ago
XDO:一种用于外部形式博弈的双预言机算法
本文提出 Policy Space Response Oracles (PSRO)、Extensive-Form Double Oracle (XDO) 和 Neural XDO 三种算法,中其中 XDO 更适用于大型博弈中的二人零和游戏,
→
PDF
3 years ago
多智能体学习的通用训练方法
本文基于博弈论原理研究了一种基于人口统计的培训体系 —— 策略空间响应神谕(PSRO),并将其扩展到广义和多人游戏中。通过使用另一种解决方案概念 $\alpha$-Rank,在一些游戏分类中建立了收敛保证,并确定了 Nash 平衡和 $\a
→
PDF
5 years ago
Prev
Next