BriefGPT.xyz
Jun, 2022
使用无模型多智能体强化学习掌握战术游戏Stratego
Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning
HTML
PDF
Julien Perolat, Bart de Vylder, Daniel Hennes, Eugene Tarassov, Florian Strub...
TL;DR
DeepNash是一个能够从零开始学习玩Stratego的自主智能体,利用无搜索的博弈论模型自学习深度强化学习方法,学会决策不完美信息的游戏,并超越了现有的AI方法,在2022年的Gravon游戏平台上与人类专家玩家竞争,成为全球前3名。
Abstract
We introduce
deepnash
, an
autonomous agent
capable of learning to play the
imperfect information
game
→