BriefGPT.xyz
Nov, 2012
在线学习中稳定性与后悔之间的相互作用
The Interplay Between Stability and Regret in Online Learning
HTML
PDF
Ankan Saha, Prateek Jain, Ambuj Tewari
TL;DR
本文研究在线学习算法的稳定性及其对可学性(有限后悔)的影响,提出了一种称为“前向后悔”的新指标,用于测量在线学习算法的预测性能,证明了对于在线优化问题,稳定性等价于后悔有界,且有界前向后悔等价于有界后悔,在分析现有算法的可学性方面提供了一个简单的方法。
Abstract
This paper considers the
stability
of
online learning algorithms
and its implications for learnability (bounded
regret
). We introduce a no
→