ICMLFeb, 2018

使用 MCTSnets 学习搜索

TL;DR该论文提出了一种名为 MCTSnet 的体系架构,其将基于模拟的搜索嵌入神经网络中,并通过向量嵌入扩展,评估和备份。该网络的参数进行端到端的训练优化,应用于小范围的搜索中,显著优于 MCTS 基线的性能。