Mar, 2009

一个无需参数的对冲算法

TL;DR本文聚焦于大量行动决策问题的决策理论在线学习(DTOL)。我们提出了一种全新无需参数的算法用于 DTOL,这解决了在线学习因无法在实际中优化设定学习率参数的困境。此外,我们引入了一种新的错误度量标准,该算法可以在此标准和以前的标准下实现优异的表现,接近以前有优化参数的最佳预算。