Jul, 2012

选择计算:理论和应用

TL;DR本文提出了基于贝叶斯选择问题的概率框架中的元层决策,推导出在蒙特卡罗搜索中最优策略的有限采样界,并在一次性决策问题和 Go 中展示了比基于贝叶斯算法和基于赌博算法的启发式方法更优越的启发式近似。