Jul, 2024

基于神经网络的信息集加权在玩侦察盲棋中的应用

TL;DR在不完全信息游戏中,我们扩展了之前关于信息集中状态加权的研究,通过训练两个神经网络来估计每个信息集中状态的可能性,并根据生成的权重评估了一个基于这些权重的RBC玩家,最终在公开排行榜上获得第5名。