Feb, 2022

利用相关性在低秩偏好强盗中实现更快的学习速度

TL;DR介绍了带有随机选择模型(RUM)的相关偏好赌博问题,研究了具有简单相关结构的模型是否可以实现更快的学习率,提出了一类新的基于块排序的 RUM 模型,证明了利用子集查询相比于成对查询有更大的优势,后者不能很好地利用相关性。