Mar, 2024

DouRN: 通过残差神经网络提升 DouZero

TL;DR本研究中,我们将残差网络引入到 DouZero 模型中,探索不同的架构设计并进行多角色测试,发现该模型在相同训练时间内显著提高了胜率。我们还引入了一个呼叫得分系统来辅助代理决定是否成为地主,通过这些改进,我们的模型始终优于现有版本的 DouZero 甚至有经验的人类玩家。