WWWSep, 2021

Cross DQN:用于 Feed 广告分配的跨网络深度 Q 网络

TL;DR本文提出了 Cross Deep Q Network(Cross DQN)的模型,通过交叉不同物品的嵌入来提取重要的排列信号并通过多通道注意力建模。此外,我们提出了一种辅助损失来处理广告暴露率的批级约束,以在保持个性化推荐的同时将广告暴露率限制在一定范围内,该模型经离线和在线实验证明在平台上获得了更高的收入和更好的用户体验。