Oct, 2024

从数据中学习游戏的潜在规则:一个棋类故事

TL;DR本研究解决了小型预训练生成语言模型无法有效学习复杂游戏规则的问题。通过在棋类数据上进行指令微调,研究显示28M和125M参数的小型语言模型能够学习国际象棋的规则并提出合法走法,显著减少模型的幻觉现象,提高了准确性。这项工作展示了小型模型在特定领域数据下的潜在能力,推动了游戏智能的研究进展。