Mar, 2012

蒙特卡罗树搜索中的贝叶斯推断

TL;DR本文介绍了一种基于贝叶斯框架与高斯近似算法的 Monte-Carlo Tree Search 方法,旨在更准确地估算节点价值和不确定性,并证明了该方法的在策略和非策略情境下的收敛性和实现的优越性。