ICMLJun, 2013

延迟反馈下的在线学习

TL;DR本文系统研究了在线学习与延迟反馈的主题,分析了延迟对在线学习算法的遗憾值的影响,提出了黑盒元算法以及基于 UCB 算法的改进方法来解决带有延迟反馈的学习问题。