ICMLFeb, 2015

简单有效的主动偏好学习方法:只需排序!

TL;DR通过使用自适应选择的成对比较来学习排名,我们的目标是准确地恢复排名但节省比较样本。对于使用快速排序算法等有效算法的所有比较结果一致的情况,最优解为使用有效排序算法。我们在 Bradley-Terry 模型下给出了 Quicksort 的优异保证,并通过实证证明了排序算法导致了非常简单有效的积极学习策略。