BriefGPT.xyz
Ask
alpha
关键词
multiplayer games
搜索结果 - 5
迈向对称多人游戏的有原则的超越人类水平 AI
多人游戏的独特挑战在于均衡策略的非唯一性和代理人执行高度次优策略的风险。本文首次解决了多人对称标准形式游戏中的这些挑战,给出了 AI 代理人应该找到的正确解决方案以及能够证明解决该类游戏的通用算法框架。我们还证明了许多先前实用系统中开发的元
→
PDF
a month ago
了解你的敌人:在 Pommerman 中使用对手模型研究 Monte-Carlo 树搜索
本研究探讨了将多人博弈转化为单人和双人博弈的技术,并通过使用启发式和自我对弈等方法,研究了对手建模的现象。同时在监督学习和强化学习环境下展示了多人搜索变异体的有效性。
PDF
a year ago
采用最小最大初始化的虚构对弈
通过策略初始化来减少虚拟博弈中的均衡近似误差,其中最具优势的方法是用 maximin 求解非凸二次规划,与传统方法相比,使用 5 种初始化的情况下,可以将近 75%的近似误差降低。
PDF
2 years ago
游戏中的套期保值:外部和换手遗憾更快的收敛
本文研究了 Hedge 算法在 n 操作游戏中的运行,得出 Hedge 算法的乐观版本的遗憾率以及基础 Hedge 的收敛速率,对于多人游戏,我们使用 Blum 和 Mansour 的经典算法寻找均衡从而得到了我们的结果。
PDF
4 years ago
从批量数据学习一般和马尔可夫博弈的纳什均衡
本文研究如何通过神经网络模型,在多人马尔可夫博弈中学习纳什均衡,解决了多人非零和博弈策略复杂难以获得的问题,并提出了新的图像质量度量方法。
PDF
8 years ago
Prev
Next