NIPSOct, 2015

Bandits 问题的 Pareto 遗憾前沿

TL;DR针对多臂赌博机问题,该研究研究了如何通过实现更小的针对某些特殊操作的最差后果来达到更好的结果,最终给出解决方案并进行了上下界的讨论。