Mar, 2017
点击反馈的伯努利一级臂老虎机
Bernoulli Rank-$1$ Bandits for Click Feedback
Sumeet Katariya, Branislav Kveton, Csaba Szepesvári, Claire Vernade, Zheng Wen
TL;DR该研究提出了基于位置的模型来解释用户点击搜索结果的概率,并提出了 Bernoulli rank-1 bandit 和 Rank1ElimKL 算法来解决排名问题。该算法在不同条件下的实验表现证实其较简单的对手策略更加优秀。