Oct, 2016

利用硬币投注改进强适应在线学习

TL;DR本文提出了一种新的无需额外参数的在线学习算法,适用于不断变化的环境,并获得了至少 sqrt (log (T)) 倍于已有算法的强适应性遗憾界。经实验证明,在专家建议和度量学习场景中,我们的算法优于现有的最先进方法。