Nov, 2012

在线学习中稳定性与后悔之间的相互作用

TL;DR本文研究在线学习算法的稳定性及其对可学性(有限后悔)的影响,提出了一种称为“前向后悔”的新指标,用于测量在线学习算法的预测性能,证明了对于在线优化问题,稳定性等价于后悔有界,且有界前向后悔等价于有界后悔,在分析现有算法的可学性方面提供了一个简单的方法。