ElasticRec:一种基于微服务的模型服务架构,实现对推荐模型的弹性资源扩缩容
我们的研究针对当前基于注意力模型的顺序推荐系统(SRSs)在计算和资源效率方面存在的困难进行了探讨,提出了结合自动修剪技术和先进模型架构的新方法。我们还探索了资源受限的神经架构搜索技术在减少计算成本、延迟和能源消耗方面的潜力,同时保持或提高准确性。我们的研究通过在三个基准数据集上进行详尽的实验验证了我们方法的有效性,证明了 EASRec 在 SRSs 中的优越性。这标志着在这个快速发展的领域内,我们为未来对高效准确的推荐系统的探索设定了新的标准。
Feb, 2024
EasyRec 是一款易于使用、可扩展且高效的推荐框架,采用模块化设计模式,通过超参数优化和特征选择算法,实现自动化模型性能提升以适应不断变化的数据分布,适用于工业推荐系统。
Sep, 2022
针对内容提供者,我们提出了一个适用于推荐系统的追索框架,旨在理解模型在做出特定预测和推荐时的基本原理,并通过对三个真实数据集上训练的推荐系统进行实证评估,展示了 RecRec 在生成有效、稀疏和可执行的追索方面的高效性。据我们所知,这项工作是首次对推荐系统生成追索的概念进行了概括和实证测试。
Aug, 2023
提出一种基于边缘计算的推荐系统 (EdgeRec),通过异构用户行为序列建模和行为注意力网络对推荐结果进行上下文感知的调整,实现实时用户感知和系统反馈,并通过淘宝主页数据的离线评估和在线性能测试证明了其有效性。
May, 2020
本文提出了一种利用推荐系统训练独特属性设计嵌入式缓存的 ScratchPipe 架构,旨在解决推荐系统训练中由于嵌入层占用过多内存而导致性能低下的问题。
May, 2022
这篇论文介绍了一种将大型语言模型与传统推荐系统相结合的解决方案,能够有效地实现顺序推荐,同时解决了大型语言模型在个性化推荐中的挑战。
Dec, 2023
本文介绍一种深度强化学习模型 Reclaimer,它可以适应微服务的数量和行为的运行时变化,从而在满足服务质量要求的情况下最小化 CPU 核心分配,我们的评估证明 Reclaimer 相对于行业标准缩放解决方案可将平均 CPU 内核分配降低 38.4%至 74.4%,相对于当前最先进的方法降低 27.5%至 58.1%。
Apr, 2023
NASRec 是一种用于优化推荐系统的模型,其使用了深度神经网络,通过单一的 supernet,通过权重共享实现了丰富的模型 / 子架构,克服了数据多模性和架构异质性挑战,并在三个 CTR 预测基准测试中取得了有希望的结果。
Jul, 2022
我们提出了一个实时房地产推荐系统,RE-RecSys,它已在实际产业环境中实施。我们基于可用的历史数据将用户分为四个类别:i)冷启动用户;ii)短期用户;iii)长期用户;和 iv)短长期用户。对于冷启动用户,我们提出了一种基于地区热度和用户偏好的新型规则引擎。对于短期用户,我们提出使用基于内容过滤模型的推荐属性,该模型根据用户最近的互动进行推荐。对于长期和短长期用户,我们提出了一种结合内容和协作过滤的新颖方法,可以轻松实施于实际情景。此外,根据转化率,我们为平台上用户执行的不同印象设计了一种新颖的加权方案,用于内容和协作模型的训练。最后,我们展示了来自印度领先房地产平台的实际房产和点击流数据集上所提出的管道 RE-RecSys 的效率。我们表明,所提出的管道可以在实际情景中部署,平均延迟小于 40 毫秒,每分钟处理 1000 次请求。
Apr, 2024
该研究提出了一种基于训练数据分布和模型特征的优化的 RecShard 方法,适用于嵌套的内存架构中对深度学习推荐模型 (Deep Learning Recommendation Models, DLRMs) 中的 EMB 内存表进行分区和布局,能够有效地提高训练吞吐量。
Jan, 2022