使用深度卷积神经网络评估围棋落子

Dec, 2014

使用深度卷积神经网络评估围棋落子

Move Evaluation in Go Using Deep Convolutional Neural Networks

Chris J. Maddison, Aja Huang, Ilya Sutskever, David Silver

TL;DR本文旨在通过深度卷积网络对围棋高手的数据进行监督学习，以期望训练神经网络自行评估围棋中的局面，并在二人对弈时直接利用该神经网络，结果显示其胜率达到了 97%。

Abstract

The game of Go is more challenging than other board games, due to the difficulty of constructing a position or move evaluation function. In this paper we investigate whether deep convolutional networks can be used to directly represent and learn this knowledge. We train a large 12-laye

go game deep convolutional networks supervised learning monte-carlo tree search expert move

发现论文，激发创造

教深度卷积神经网络下围棋

本文介绍了使用卷积神经网络进行围棋下棋预测的方法，采用一些新的技术，包括用于捆绑网络中的权重的方法，以硬编码预期存在于目标函数中的对称性，并证明它们在消融研究中可以显著提高性能。最终网络能够在两个不同的围棋数据集上达到 41.1％和 44.4％的移动预测精度，同时还能够击败著名的围棋程序 GNU Go，表明它是不使用蒙特卡罗树搜索的最先进程序之一。

Dec, 2014

使用深度神经网络学习下棋（奥赛罗棋）

本研究通过使用卷积神经网络对黑白棋游戏（Othello）中的移动预测器进行测试，证实了神经运动预测器具有非常高的能力和与游戏强度之间的强相关性，并在强度和预测准确度上超过了以前的最佳算法和现有的最强开源算法 Edax。

Nov, 2017

超越蒙特卡罗树搜索：使用深度备选神经网络和长期评估玩围棋

本文提出了一种使用深度替代神经网络（DANN）和长期评估模块的计算机围棋系统，其中 DANN 的效果优于传统的深度卷积神经网络（DCNN），并结合长期评估模块的选择比大多数现有的基于蒙特卡罗树搜索的开源引擎更好。

Jun, 2017

神经网络与长期预测的更好的计算机围棋选手

使用基于深度卷积神经网络的纯模式匹配方法取代传统搜索技术，达到与蒙特卡罗树搜索（MCTS）等开源 Go 引擎相同的优异运行效果，且具有更高的赢率和更强的稳定性，同时也在 KGS Go Server 上稳定达到 3d 级别的胜负表现，而 darkfmcts3 则在比赛中获得了第三名的好成绩。

Nov, 2015

解析神经网络对弈围棋及人类学习

AI 模型在围棋游戏中超越了人类选手，解释 AI 模型所编码的围棋知识并将其用于教导人类选手代表着一个具有前景但具有挑战性的问题。为此，本文提取围棋游戏价值网络所编码的棋子之间的交互原语，以使人们能够从价值网络中学习。实验表明了我们方法的有效性。

Oct, 2023

利用深度学习人工智能拓展对古老围棋游戏的理解成本

本论文发展了一种基于 AI 和深度学习神经网络的数值工具，用于对围棋游戏中的每一步的表现进行自动化评估，并识别游戏特征，通过使用 “过” 的代价来衡量落子的紧迫性，即在相同棋盘位置下，落子前后的局面分差，研究了该度量的特性并描述了一些应用。

Aug, 2022

基于图神经网络的谷歌研究足球智能体

本文提出了一种基于图神经网络（GNN）的深度 Q 学习网络（DQN），在 Google Research Football 框架下，将卷积神经网络难以提取足够信息的小地图输入转化成图形式，优化了估计值函数并提高了通信效率。实验证明，该模型在玩足球游戏中表现优秀，且训练速度快于其他 DRL 模型。

Apr, 2022

DeepChess: 棋类自动学习的端到端深度神经网络

本文介绍了一种基于深度神经网络的端到端学习方法，通过无监督预训练和有监督训练来训练神经网络，实现了无先验知识的自动下棋策略，结果表明 DeepChess 能够和经过多年人工调整的机器下棋程序相媲美，是第一个能够实现国际象棋特级大师水平的端到端机器学习方法。

Nov, 2017

5*5 多人围棋的深度强化学习

使用搜索算法和深度强化学习，本文提出并分析了使用 AlphaZero 和 Descent 算法自动学习多人版围棋。进一步展示了搜索算法和深度强化学习提高了棋局水平的结果。

May, 2024

Monte-Carlo 树搜索和卷积神经网络的协作创新

研究人机协作绘图环境，在其中自主代理绘制图像的同时，可选择允许用户直接影响代理的轨迹。我们结合了蒙特卡罗树搜索和图像分类器，测试了浅层模型（例如多项式逻辑回归）和深度卷积神经网络（例如 LeNet，Inception v3）。我们发现，使用浅层模型，代理会产生有限种类的图像，这些图像显然对人类来说是可识别的。然而，使用更深层次的模型，代理产生了更多样化的图像，尽管代理非常有信心（99.99％）地完成了其目标，但在人类眼中，它们大多类似于不可识别的 “随机” 噪声。这与最近的研究有关，该研究也发现 “深度神经网络很容易被愚弄”，我们讨论了可能的解决方案和未来的研究方向。

Dec, 2016