Feb, 2022

上下文不确定性下的上下文匹配带,及其在推荐系统中的应用

TL;DR该论文提出了一种新型的循环探索网络,用于在潜在空间中进行表示学习和有效的探索,以平衡相关性和多样性,同时考虑表示中的不确定性,理论分析表明,该网络即使存在学习表示中的不确定性,也能保持速率最优的次线性遗憾,实证研究证明了该网络在综合和真实推荐数据集上能够实现令人满意的长期奖励,优于现有最先进的模型。