神经臂带的元聚类
介绍一种基于自适应聚类探索-利用(“赌徒”)策略的内容推荐算法,提供标准随机噪声环境下的尖锐遗憾分析,证明其伸缩性属性并在一些人工和实际数据集上证明其有效性。实验结果显示,在赌徒问题上,预测性能显著优于现有技术方法。
Jan, 2014
CAB算法是一种协同推荐算法,它采用了上下文相关的用户邻域估计机制,能够同时进行探索利用平衡和协同步骤,证明了具有不同数据假设的后悔边界,并在生产和真实数据集上验证了CAB的显着预测性能优势。
Aug, 2016
本研究基于在线聚类算法探讨了上下文串联赌博机算法的新领域,针对用户间的聚类问题进行了广泛研究,并提出了一种新的算法 CLUB-cascade。实验显示,该算法可以有效地解决网络系统的信息推荐问题。
Nov, 2017
通过Bayesian Latent Organic Bandit模型将机器推荐的有干预(bandit)和无干预(organic)记录进行有机的结合,通过使用可变自编码器实现扩展以及本地重参数技巧技术实现可扩展的近似全模型并证明在有机环境和有干预环境中均优于最先进的有机推荐算法和干预算法(价值和基于策略的)
Aug, 2020
通过构建神经协同过滤自适应组Metaban算法,本文将人工智能中的探究与利用困境(exploitation-exploration dilemma)应用于定制化推荐,并在实验中将Metaban与六种模型进行对比,结果表明Metaban显著优于其他模型的表现。
Jan, 2022
提出一种面向推荐系统的可扩展的高效样本神经上下文强化学习算法,Epistemic Neural Recommendation (ENR), 具有比基线算法更高的点击率和用户评分,并且具有比最佳基线算法少29%的用户交互,同时计算资源需求明显较低。
Jun, 2023
在线商业领域,推荐系统对增强用户体验至关重要。本篇研究论文探讨了基于上下文的强化学习模型——上下文强化学习框架,作为实现个性化推荐的强大工具。我们深入研究了该领域中的挑战、先进算法与理论、协同策略,以及开放性问题和未来前景。与现有相关教程不同,(1)我们专注于上下文强化学习的探索视角,以减轻推荐系统中的“马太效应”,即物品的热门度导致富者更富、贫者更贫;(2)除了传统的线性上下文强化学习,我们还将专注于神经上下文强化学习,近年来成为重要的分支,从经验和理论两方面探究神经网络如何增进上下文强化学习的个性化推荐;(3)我们将介绍最新的话题——协同神经上下文强化学习,以结合用户异质性和用户相关性,为推荐系统定制;(4)我们将提供和讨论神经上下文强化学习在个性化推荐中的新兴挑战和未解问题,特别是对于大型神经模型。
Dec, 2023
通过引入神经网络增强情境强化学习,本文提出了一种适用于大规模推荐系统的联合神经情境强化学习解决方案,该方案将所有推荐物品集成到一个单一模型中,并通过理论分析和实验结果揭示了超参数调整过程中的不确定性,为离线训练和在线部署提供了帮助。
Jun, 2024