Sep, 2018

关于 Hedge 算法在随机制度下的最优性

TL;DR研究了在线随机环境下的 Hedge 算法行为,证明了降低学习率的任何时候版本,能够同时适应较容易的随机问题和顶峰问题,并与其他变体算法的表现有质的差异,最终讨论了该算法的局限性和 Stochastic 情况下双重遗憾边界带来的改进。