Sep, 2023

关于在线排名中的最小化后悔问题与前 k 反馈

TL;DR在线排名中,使用学习算法对一组项目进行顺序排名,并将排名的相关度以反馈分数的形式接收。本文通过解决 Chaudhuri 和 Tewari [2017] 提出的一些开放性问题,进一步研究了带有前 k 个项目反馈的在线排名问题,并为 Pairwise Loss,Discounted Cumulative Gain 和 Precision@n 等排名性能度量提供了最小化后悔率的完整刻画。此外,我们还给出了一种高效的算法,实现了在 Precision@n 上的最小化后悔率。