ICMLMay, 2016

Copeland 决斗问题:损失下限,最佳算法和高效算法

TL;DR研究了 K-armed dueling bandit 问题,提出了 CW-RMED 和 ECW-RMED 算法来解决 Copeland winners 的推荐问题,并通过实验比较证明 ECW-RMED 算法的有效性优于现有算法。