神经臂带的元聚类

Aug, 2024

Meta Clustering of Neural Bandits

Yikun Ban, Yunzhe Qi, Tianxin Wei, Lihui Liu, Jingrui He

TL;DR本文解决了推荐系统中用户异质性与相关性之间的平衡问题，提出了一种新颖的算法M-CNB，用以增强神经臂带的聚类能力。研究表明，该算法在动态聚类适应性与探索策略方面表现出色，实验结果显示M-CNB在推荐和在线分类任务中超过了现有最优方法。

Abstract

The contextual bandit has been identified as a powerful framework to formulate the recommendation process as a sequential decision-making process, where each item is regarded as an arm and the objective is to minimize the regret of $T$ rounds. In this paper, we study a new problem, Clustering

发现论文，激发创造

加速上下文强化学习的分层探索

本文提出了一种粗到细的分层方法，通过编码先验知识显著减少了探索用户反馈所需的工作量，其效果得到了广泛模拟和用户研究的证明，适用于个性化新闻推荐。

Jun, 2012

在线集群化的赌博机

介绍一种基于自适应聚类探索-利用(“赌徒”)策略的内容推荐算法，提供标准随机噪声环境下的尖锐遗憾分析，证明其伸缩性属性并在一些人工和实际数据集上证明其有效性。实验结果显示，在赌徒问题上，预测性能显著优于现有技术方法。

Jan, 2014

关于上下文相关赌博机聚类的研究

CAB算法是一种协同推荐算法，它采用了上下文相关的用户邻域估计机制，能够同时进行探索利用平衡和协同步骤，证明了具有不同数据假设的后悔边界，并在生产和真实数据集上验证了CAB的显着预测性能优势。

Aug, 2016

上下文串联赌博机的在线聚类

本研究基于在线聚类算法探讨了上下文串联赌博机算法的新领域，针对用户间的聚类问题进行了广泛研究，并提出了一种新的算法 CLUB-cascade。实验显示，该算法可以有效地解决网络系统的信息推荐问题。

Nov, 2017

BLOB：一种结合有机和强化信号的推荐概率模型

通过Bayesian Latent Organic Bandit模型将机器推荐的有干预（bandit）和无干预（organic）记录进行有机的结合，通过使用可变自编码器实现扩展以及本地重参数技巧技术实现可扩展的近似全模型并证明在有机环境和有干预环境中均优于最先进的有机推荐算法和干预算法（价值和基于策略的）

Aug, 2020

元学习下的神经协作过滤赌博机

通过构建神经协同过滤自适应组Metaban算法，本文将人工智能中的探究与利用困境（exploitation-exploration dilemma）应用于定制化推荐，并在实验中将Metaban与六种模型进行对比，结果表明Metaban显著优于其他模型的表现。

Jan, 2022

可扩展的神经上下文Bandit算法用于推荐系统

提出一种面向推荐系统的可扩展的高效样本神经上下文强化学习算法，Epistemic Neural Recommendation (ENR)，具有比基线算法更高的点击率和用户评分，并且具有比最佳基线算法少29%的用户交互，同时计算资源需求明显较低。

Jun, 2023

图神经臂带

通过图神经网络，本论文提出了一种名为图神经赌博（GNB）的框架，旨在利用用户之间的协作特性来提高在线推荐系统的性能，并通过理论分析和实证研究验证了我们提出的框架的有效性。

Aug, 2023

个性化推荐的神经上下文强化学习

在线商业领域，推荐系统对增强用户体验至关重要。本篇研究论文探讨了基于上下文的强化学习模型——上下文强化学习框架，作为实现个性化推荐的强大工具。我们深入研究了该领域中的挑战、先进算法与理论、协同策略，以及开放性问题和未来前景。与现有相关教程不同，（1）我们专注于上下文强化学习的探索视角，以减轻推荐系统中的“马太效应”，即物品的热门度导致富者更富、贫者更贫；（2）除了传统的线性上下文强化学习，我们还将专注于神经上下文强化学习，近年来成为重要的分支，从经验和理论两方面探究神经网络如何增进上下文强化学习的个性化推荐；（3）我们将介绍最新的话题——协同神经上下文强化学习，以结合用户异质性和用户相关性，为推荐系统定制；（4）我们将提供和讨论神经上下文强化学习在个性化推荐中的新兴挑战和未解问题，特别是对于大型神经模型。

Dec, 2023

联合神经情境强化学习中的不确定性

通过引入神经网络增强情境强化学习，本文提出了一种适用于大规模推荐系统的联合神经情境强化学习解决方案，该方案将所有推荐物品集成到一个单一模型中，并通过理论分析和实验结果揭示了超参数调整过程中的不确定性，为离线训练和在线部署提供了帮助。

Jun, 2024