阿里巴巴电商认知概念网络
本文介绍了一种称为 Query Understanding 的语义搜索方法,针对电子商务搜索,提出了一种简化的本体框架,探讨了基于该框架的商品分类自动提取方法,并进行了绩效比较。
Jul, 2018
本文介绍了一种名为 AliCG 的框架,它可以通过新颖的自举方法来提取细粒度的概念,使用低资源短语挖掘方法挖掘长尾概念,并利用基于用户行为的概念分布估计方法动态更新概念图。在阿里巴巴 UC 浏览器上对该框架进行了离线评估和在线 A/B 测试,证明了我们的方法的有效性。
Jun, 2021
本论文提出了 FolkScope—— 基于知识图谱构建的意图知识框架,借助大规模语言模型的生成能力和人机交互的标注,半自动地构建知识图谱,显现人类在电子商务平台购买商品过程中的意图结构,讨论了其内在质量和外部应用,证明其能够很好地模拟常识性的 e-commerce 知识。
Nov, 2022
通过增强的表示学习和细粒度实例关系的对比损失,以及关注内在标签分类法的细粒度层次分类损失,我们提出了一种新颖的框架来解决层次化查询分类的挑战,同时利用与已标注查询共享的无标签查询的相似性智能地选择这些查询以提高分类性能。实验证明,我们的方法优于专有的 Amazon 数据集上的最先进方法,并与 Web of Science 和 RCV1-V2 的公共数据集中的最先进方法相媲美,这些结果凸显了我们提出解决方案的有效性,并为下一代层次感知查询分类系统铺平了道路。
Mar, 2024
本文介绍了阿里巴巴的大规模视觉搜索算法和系统架构,并探讨了在电商环境下如何处理异构的图像数据,在大数据更新中如何处理大规模索引,如何在无大量人工注释的情况下训练有效的深度模型,以及如何通过考虑内容质量来提高用户参与度,最后将所有阶段应用于一个端到端的系统架构,并展示了实验结果。
Feb, 2021
本文提出了一种自我监督和用户行为导向的产品分类法拓展框架,通过从现有的分类法和用户点击日志中抽取用户感兴趣的候选下义词关系并利用预训练语言模型和图神经网络结合对比学习来建模概念和关系,以自动将新概念附加到现有分类法,从而减少手动更新的人力成本。
Mar, 2022
识别和理解用户意图是电子商务的一个关键任务。本文针对预测用户意图展开研究,将意图理解视为自然语言推理任务,并独立于产品本体论。我们发现 SOTA 电子商务意图知识图 FolkScope 存在两个弱点,限制了其对用户意图的推理以及对多样有用产品的推荐能力。基于这些观察,我们引入了一个产品恢复基准,包括一种新颖的评估框架和一个示例数据集,并在该基准上进一步验证了 FolkScope 的上述弱点。
Feb, 2024
本文介绍了 ConcepT 在 Tencent QQ 浏览器中的实现和部署经验,该算法从大量的用户查询和交互搜索点击日志中挖掘用户中心概念,并用于文档标签和主题 - 概念 - 实例分类法,从而提高了搜索和新闻推荐的效率。在线 A/B 测试的结果表明,在将用户中心概念纳入 Tencent QQ 浏览器的推荐框架后,新闻推荐的印象效率提高了 6.01%。
May, 2019
本文提出了一种基于机器翻译的产品分类新范式,通过将产品的自然语言描述翻译成代表产品分类树中从根到叶子的路径的一系列标记,实现了比最先进的分类系统更好的预测准确性,并且可以在分类树中提出有意义的新路径,将其转换为有向无环图,从而有助于用户友好浏览和适应新产品的分类。
Dec, 2018