Jun, 2022

使用无模型多智能体强化学习掌握战术游戏Stratego

TL;DRDeepNash是一个能够从零开始学习玩Stratego的自主智能体,利用无搜索的博弈论模型自学习深度强化学习方法,学会决策不完美信息的游戏,并超越了现有的AI方法,在2022年的Gravon游戏平台上与人类专家玩家竞争,成为全球前3名。