- 基于 LLM 的推荐系统中的隐私保护:最新进展与未来发展方向
最近,大语言模型(LLMs)已经与传统的推荐模型相结合,以提高推荐性能。然而,尽管大多数现有的研究都集中在提高模型性能方面,但隐私问题只得到了相对较少的关注。在本文中,我们对基于 LLMs 的推荐系统中的隐私问题进行了综述,将其分为隐私攻击 - 基于大型语言模型的新闻推荐与分类描述
利用大型语言模型自动生成新闻分类描述,并将其作为附加信息融入推荐模型,大幅提高了个性化新闻推荐的准确性。
- 通过动态跳过陈旧嵌入来加速推荐模型训练
Slipstream 是一个软件框架,通过识别过时的嵌入并跳过其更新来提高性能,在真实世界的数据集和配置方面,相比 Baseline XDL、Intel-optimized DRLM、FAE 和 Hotline,SlipStream 分别展 - 个性化负反馈贮存器在推荐系统中的增量学习
为了改善用户体验,推荐系统需要不断扩展和提升模型,但这会带来更多的计算负担。本文提出了个性化的负样本储备策略,平衡了遗忘与可塑性,有效地处理增量学习问题。通过在三个常用的增量推荐模型中整合我们的设计,我们实现了在标准基准测试中的最新成果。
- 悟空:大规模推荐系统的缩放定律探索
提出了一种基于堆叠因子分解机的有效网络架构和协同放大策略 Wukong,以在推荐领域建立缩放律。通过更高更宽的层次结构,Wukong 能够捕捉到各种任意顺序的交互,同时在质量上始终优于其他最先进的模型,并且在模型复杂性上保持缩放律。
- Stack Overflow 回答中信息突出的初步研究
我们的研究发现,可以开发推荐模型来突出展示 Stack Overflow 上具有不同格式样式答案的信息。
- BSL:理解和改进用于推荐的 Softmax 损失函数
通过理论分析我们发现 Softmax loss (SL) 的强大性能是由于对负数据分布进行了 Distributionally Robust Optimization (DRO),因此具有鲁棒性;相较于其他损失函数,SL 隐式地惩罚预测方差 - DPR:缓解推荐反馈循环中的偏见累积算法
根据部署的推荐系统收集到的用户反馈进行训练的推荐模型常常存在偏见,而且由于用户反馈受到暴露机制的影响,会产生大量误负样本。本研究深入分析了数据暴露机制以及反馈循环对推荐质量和用户体验的负面影响,并提出了一种无偏算法来减轻暴露机制和反馈循环的 - 推荐模型扩展时的嵌入器溃缩问题研究
通过对扩大模型的嵌入层进行实证和理论分析,研究人员发现嵌入坍塌现象是限制大规模推荐模型可扩展性的关键问题,并提出一种多嵌入设计来捕捉不同模式并减少崩溃,从而为各种推荐模型提供一致的扩展性。
- Ad-Rec: 处理推荐网络的协变量偏移的高级特征交互
本文介绍了一种名为 Ad-Rec 的高级网络,它利用特征交互技术来解决协变量偏移问题,在推荐任务中消除了不相关的交互,通过遮蔽变换器实现了学习高阶交叉特征,并减轻数据分布漂移的影响。我们的方法通过综合消融研究证明了 Ad-Rec 的可扩展性 - gSASRec:用负采样训练的序列推荐系统中减少过度自信的方法
本文研究了推荐模型中的目录规模、负采样、过度自信等问题,并提出了 gBCE 损失函数和 gSASRec 模型,通过实验证明 gSASRec 在大规模数据集中表现优异,与 BERT4Rec 相比能够在更短的训练时间内获得更好的推荐效果。
- SSLRec:基于自监督学习的推荐系统学习库
自我监督学习在推荐系统中解决数据稀疏和噪声的挑战中引起了广泛关注。但目前缺乏统一框架来集成不同领域的推荐算法,为此我们引入了 SSLRec,一个基准平台,为评估各种 SSL 增强的推荐器提供了标准化、灵活和综合的框架,并简化了不同推荐模型的 - OpenSiteRec:网站推荐的开放数据集
本研究旨在为品牌发展提供有益和关键的信息检索任务之一的场所推荐,建立一个全面的数据集,名为 OpenSiteRec。OpenSiteRec 利用异构图模式表示各种类型的真实世界实体和关系,以评估推荐模型在场所推荐任务上的性能。
- 使用多模态 Transformer 进行基于帧的直播流点击率预测
本文提出了一种基于多模态 Transformer 的 ContentCTR 模型,采用帧级别的 CTR 预测来充分利用视觉帧、音频和评论等多模态信息,借助具有一阶差分约束的新型成对损失函数来利用亮点和非亮点间的对比信息,以及基于动态时间规整 - 推荐系统中的数据异构性探索和利用
本文针对数据推荐模型中的异质性问题进行研究,通过双层聚类算法,探索了预测机制和协变量分布的异质性,并将其应用于预测和失真校正中,实验证明探索和利用数据异质性在推荐系统中的有效性。
- 了解文化对在线评论有用性评估的影响
本文针对在线评论过多令用户难以选择的问题,提出利用文化背景作为特征来评估在线评论的实用性,并通过对阿拉伯和西方文化圈中关于酒店和书籍的不同在线评论进行深入分析,发现基于文化背景评估评论可以提高推荐准确度,并开发了六个不同的评论推荐模型来证明 - 面向大型推荐系统嵌入的频率感知软件缓存
本文提出了一种基于 GPU 的软件缓存方法来动态管理 DLRM 的 embedding table,通过利用目标数据集 id 的频率统计信息,在 GPU 和 CPU 内存空间之间进行管理,以此来使得在 GPU 上训练 DLRM 更为实用。同 - KDD通过元控制器实现设备云协同推荐
本研究提出一种基于 meta 控制器和因果透视的样本构建方法以解决设备层和云端层之间协同推荐的问题,并在工业推荐场景中展示了 meta 控制器的潜力。
- 关于上下文信息对兴趣点推荐影响的系统分析
本文提出了不同的上下文模型,分析了 POI 推荐中不同主要上下文信息的融合。主要贡献是:提供了对上下文感知定位推荐的广泛调查,量化和分析不同上下文信息在 POI 推荐中的影响,并使用两个着名的现实世界数据集评估了所考虑的模型。我们的结果表明 - 深度学习推荐模型快速可扩展训练的软件硬件协同设计
本文介绍了使用 PyTorch 和 Zion platform 的高性能可扩展软件堆栈的 SW/HW 共同设计方案,用于高效训练大规模 DLRMs,实现了可分层分区和高性能的数据通信等多项优化,从而在之前系统的基础上将训练时间提速了 40