- 超越:生成模型能超过训练它们的专家
研究表明,通过低温抽样,训练生成模型可以实现超越数据生成专家的能力,这在国际象棋中得到了实验证明。
- 预测国际象棋中用户对着棋棋力的感知
研究论文说明了如何使用神经网络和棋局形状特征对象标准为 “卓越” 的棋局进行分类,达到了 79%的准确性,揭示了较弱引擎对棋局评价较低时更有可能被预测为 “卓越” 的特点,引领了计算机国际象棋引擎展示类似人类卓越和创意的可能性。
- 无搜索的国际大师级棋局
研究表明,机器学习中的重要突破主要归功于规模,特别是大规模的基于注意力的架构和空前规模的数据集。本文通过在一个包含一千万局国际象棋比赛的数据集上对一个含有 2.7 亿个参数的 transformer 模型进行监督学习,利用由强大的 Stoc - 大型语言模型在国际象棋棋盘上的应用:对 ChatGPT 的形式语言理解和复杂推理能力的研究
这篇论文通过探究 ChatGPT(OpenAI 的先进语言模型)处理复杂推理任务(以国际象棋为例)的表现,利用评估棋盘理解、国际象棋规则遵守和战略决策能力的健全指标来识别其注意机制和自我调节能力的局限性,以及在自然语言体量较大或棋盘状态理解 - 多元化人工智能:向着 AlphaZero 创造性中国象棋的方向发展
通过在国际象棋中构建多样化的人工智能团队,研究表明多样性对于解决复杂计算问题具有价值,并能使团队中的人工智能系统产生出更多有创造性的决策机制。
- 棋盘价值
本篇论文主要探讨了利用人工智能 (AI) 来评估国际象棋中不同棋子的定价以及旗子的定位的方法,并且通过引入边际定价法对该方法进行了加强,并讨论了马和象的位置定位以及兵的估值,此外还讨论了 Nimzowitsch 的兵的结构和估值理论。最终, - 表征很重要:国际象棋对视觉转换器提出了挑战
通过简单调整输入格式和价值损失函数,超越 AlphaZero 许多的方式,来在最古老的 AI 基准测试领域之一的象棋游戏中赢得胜利,仅使用视觉 Transformer,并结合 MobileNet 和 NextViT 提高 ViTs 的效率仍 - AI 驱动的机制作为裁判:在国际象棋及其他领域中决胜负
使用基于人工智能的方法来决定超时赛,通过比较选手实际走步与最佳走步的评估价值来进行判决,在所有竞技体育和 AI 巨头已经确认其优越性的游戏中都可以推广使用。
- 使用统一文本到文本转换 Transformer 进行极端多领域、多任务学习
研究了多领域文本转换转换器在 Python Code 和 Chess 领域中 4 个任务上的行为,发现 GPT 风格的联合预训练 + 联合微调策略在多领域,多任务学习中表现最好。
- 探究在国际象棋中的行为风格统计方式来检测个体的决策方式
该论文研究机器学习如何应用于人类行为识别,提出一种基于 Transformer 的应用于棋类游戏,可以在只有 100 个标记棋局的情况下正确识别出准确率达到 98% 的玩家,同时也讨论了该方法对人类行为伦理的潜在影响。
- AAAI以国际象棋为测试基地的语言模型状态跟踪
本研究通过考虑围棋的语言建模任务为基础,探索如何评估 Transformer 语言模型对文本子表面的世界状态的准确跟踪。研究发现,当仅在移动序列上进行训练时,具有足够训练数据的 Transformer 语言模型可以学习跟踪棋子并预测合法棋步 - KDD学习个体在国际象棋中的行为模型
通过开发高度精确的预测个体在下棋中的行为的模型,我们可以将人工智能系统更好地与个体的行为相一致,从而提高人 - 人工智能交互的效果。
- AAAIChess Transformer:利用生成式语言模型掌握下棋
本研究证明了自然语言变换器可以支持更通用的战略建模,特别是对于文本存档游戏。我们的 Chess Transformer 在 2.8 百万张国际象棋棋局的训练中能够生成合理的策略和经典开局的局面,加入了与人交互的方法可以正确过滤非法移动并挑战 - KDD将超级智能与人类行为相一致:以象棋为模型系统
研究人员基于人类下棋决策的详细数据,通过 AlphaZero 构建了一种定制化的人工智能引擎 Maia,能够更准确地预测人类棋手的下棋。这项研究表明,重点是建立精确的人类决策模型,安装有人类协作的人工智能系统具有很大的潜力。
- 利用原因来提高人类任务表现
研究了如何设计一个可以帮助人类玩家改善棋类游戏表现的算法,该算法利用机器学习及透明度技术生成 AI 的内部任务模型解释,提供了自动判定和指导用户的决策方法。
- 利用深度神经网络和人类数据学习国际象棋变种 Crazyhouse 超越世界冠军水平
通过利用神经网络的监督学习,提高了对于棋类游戏的效率并且降低了计算成本,从而设计出了一个专门训练于 crazyhouse 象棋的深度神经网络引擎。该引擎在 569,537 场人类游戏中进行了 1.5 天的训练,获得了 60.4% 的棋步准确 - 使用通用增强学习算法通过自我对弈掌握国际象棋和将棋
该研究介绍了使用新的 AlphaZero 算法以及无领域知识的方式进行强化学习,让计算机在三个领域的棋类游戏:围棋、象棋和将棋中均以超级专业水平进行游戏。
- DeepChess: 棋类自动学习的端到端深度神经网络
本文介绍了一种基于深度神经网络的端到端学习方法,通过无监督预训练和有监督训练来训练神经网络,实现了无先验知识的自动下棋策略,结果表明 DeepChess 能够和经过多年人工调整的机器下棋程序相媲美,是第一个能够实现国际象棋特级大师水平的端到 - 风格转移生成对抗网络:不同的学习国际象棋方式
本论文提出了一个使用生成对抗网络的鉴别器来调整生成器与原有的分离的损失函数,从而推广风格迁移的概念作为棋类游戏学习的方法,并以具体玩家为风格,给出了实证研究。
- TDLeaf (lambda): 将时间差分学习与博弈树搜索相结合
本文介绍了 TDLeaf (lambda) 算法及其在博弈领域的应用,通过在国际象棋和纸上谈兵游戏中的测试实验,展示了其实用性和与传统算法 TD (lambda) 和 TD-directed (lambda) 的比较结果。在国际象棋程序 K