May, 2018

复杂排版中相关性和显示偏好的排名

TL;DR本文提出了一种基于深度强化学习的 Double-Rank Model(DRM)方法,能够处理复杂的排序设置,包括通过弱奖励信号学习文档和位置的最佳排序和布局,这种方法优于现有的方法并提高了排序性能。