May, 2014

通过平滑实现在线线性优化

TL;DR本文介绍了一种新的优化理论方法,用于分析使用扰动作为正则化工具实现 Follow-the-Leader 程序的特定设置,该方法包括添加强凸罚函数到决策规则和添加随机扰动到数据的方法,并在 Follow the Regularized Leader 和 Follow the Perturbed Leader 之间建立了等价关系,从而得出了一个可以恢复和改进先前已知后悔上限的算法类 Follow the Perturbed Leader 的通用分析框架。