Sep, 2024

基于模型预测控制、强化学习与回滚的优越计算机国际象棋

TL;DR本文解决了计算机国际象棋中的移动选择问题,通过模型预测控制、回滚和强化学习的方法引入了一种新的架构。研究结果表明,该架构显著提升了位置评估引擎的性能,为各种水平的国际象棋引擎增加了一层智能。