大规模定向广告系统的多流形学习
提出了一种名为自适应流形的方法,用于解决在真实数据集不平衡环境下的转导式 few-shot 学习,该方法利用标记支持示例和无标签查询的底层流形来预测每个查询的类概率分布,并优化所有参数,表现出比其他最先进方法更好的性能。
Apr, 2023
本文提出了一种基于流形学习的哈希方法,包括解决样本外数据问题的有效归纳解决方案和用非参数流形学习作为哈希方法基础的过程,以提高现有算法的规模,并展示了基于 t-SNE 的哈希方法在大规模基准数据集上的优越性和通过最小化量化误差以及加入标签信息等方法进一步提高语义检索性能的应用。
Dec, 2014
本文通过研究在非欧几里得空间中学习用户和项目表示的概念,探讨了超宇称空间中度量学习和协同过滤之间的联系,旨在通过度量学习方法填补欧几里得和双曲几何之间的差距。作者提出了概念简单但高效的 HyperML(超宇称度量学习)模型,通过一系列广泛的实验,证明了该模型不仅优于欧几里得模型,还实现了多个基准数据集的最佳表现,展示了双曲几何中个性化推荐的有效性。
Sep, 2018
我们提出了一种融合不同黎曼流形嵌入的图神经网络 (FMGNN) 架构,通过选择地标和几何核心集使不同流形之间的顶点嵌入通过不同流形之间的距离相互作用和对齐,进而在顶点分类和链路预测任务方面取得了比强基线更优秀的表现。
Apr, 2023
我们提出一个方法,通过使用多模态用户活动的序列基本特征学习模块进行异步学习,可以为每天数十亿用户学习高逼真的用户嵌入。这些异步学习的用户表示嵌入(ALURE)通过图学习转化为用户相似性图,并与用户实时活动相结合,为整个广告发布系统检索与之高度相关的广告候选项。在线下和在线实验中,我们的方法显示出显著的增益。
Jun, 2024
本研究提出了 Distance Learner 方法,利用 “流形假设” 作为先验知识,对于 DNN-based 分类器进行训练,结果表明 Distance Learner 相比标准分类器学习到更有意义的分类边界,并且在对抗鲁棒性任务中表现出色。
Jul, 2022
提出了一个自适应混合曲率广告检索系统(AMCAD),可以自动捕获非欧几里德(Euclidean)空间中的复杂和异构图结构,采用自适应混合曲率空间表示实体,并设计了注意力机制来模拟异构节点之间的相似度,设计了一个高效的二层在线检索框架来部署 AMCAD。
Mar, 2022
本研究探索了在借助矩阵流形学习和优化图嵌入的情况下,如何在曲线里曼尼流形中提高图像嵌入的表现。我们的实验结果证明,在各种衡量不同图形属性的指标基础上,我们通常优于基于超球体和椭球嵌入的欧几里得嵌入,从而为非欧几里得句子嵌入在机器学习流水线中的优势提供了新的证据。
Feb, 2020