实时搜索中的事件增强检索
本文研究信息检索在实时搜索中面临的挑战,通过整合事件信息和查询,利用跨注意力机制实现时间背景的查询表示,通过多任务训练增强事件表示能力,以及通过两阶段训练和硬负采样进行模型优化,并通过实验证明本方法在时间敏感场景下显著优于现有基线方法。
Dec, 2023
本文提出了一种新的框架 Uni-Retriever,通过知识蒸馏和对比学习的方式,联合进行高相关性和高 CTR 检索的多目标学习过程,以生成嵌入式向量进行嵌入式检索,该检索方式可以实现广告检索的两个目标。经多项测试验证,该方法显著提高了 Bing 检索系统的检索效果。
Feb, 2022
提出了一种基于二进制嵌入的检索引擎,利用轻量级的转换模型和残差多层感知器 (MLP) 块将完整精度的查询和文档嵌入压缩成多个二进制向量的组合,并使用嵌入到嵌入的策略来实现无需任务的高效训练。对离线基准和在线 A/B 测试进行了广泛的实验,证明了该方法的效率和有效性,在几乎不损失系统准确性的情况下,显著节省了 30%~50% 的索引成本。
Feb, 2023
本研究探讨如何将基于嵌入式检索的技术应用于 Facebook 搜索系统,介绍了用于建模语义嵌入的统一嵌入框架和在基于倒排索引的典型搜索系统中提供嵌入式检索的系统,以及整个系统的端到端优化技巧和经验。该方法可显著改善 Facebook 搜索垂直领域的度量标准。
Jun, 2020
本文介绍了一种基于嵌入式检索的电子商务搜索技术,提出了一种多模态、多任务的搜索嵌入式检索系统,称为 Que2Engage,旨在缩小检索与排名之间的差距以及在平衡不同商业目标的同时提供更好的搜索体验。该方案在 Facebook Marketplace Search 上实施后,两周内的 A/B 测试结果表明,搜索器的参与度有了显著性的提升。
Feb, 2023
提出了 Event GDR,一种以事件为中心的生成式文档检索模型,通过将事件知识集成到任务中,解决了忽略文档内部内容相关性和标识符构建缺乏明确语义结构的两个挑战。通过多代理的交换 - 反射方法来进行事件知识提取,利用事件和关系对文档进行建模以保证全面性和内部内容相关性,将事件映射到明确的事件分类法构建标识符。实验证明,该方法在两个数据集上明显优于基线,并希望为未来的研究提供启示。
May, 2024
通过生物粒度文档表示法、稀疏嵌入与压缩感知量化等技术,采用基于深度学习的文档表示和 ANN 搜索技术,设计 Progressive Optimization 框架,实现了大规模的 EB 检索,并在百万级和百亿级的数据集上分别实现了高达 +4.3% 到 +17.5% 的提高检出率,同时在一个搜索平台上实现了较大的回报、回忆和 CTR 这些度量方面的提升。
Jan, 2022
该研究旨在提高电子商务搜索系统的相关性预测性能,并提出了一种名为基于实体的相关模型(EBRM)的新模型,将 QI 问题分解为多个 QE 相关问题并聚合其结果形成 QI 预测。
Jul, 2023
本文探讨了电子商务平台中产品检索服务的质量问题。针对嵌入式检索系统中存在的问题,提出了一种新的多粒度深层语义产品检索模型。改进的算法通过平滑噪声数据和生成硬负样本来提高相关性,并在淘宝搜索上进行了线下和在线实验,证明了其有效性,并成功应用于现有的多通道检索系统中。
Jun, 2021
提出了一种基于图增强事件嵌入的共同多事件关系提取框架 GraphERE,通过使用静态 AMR 图和 IE 图来丰富事件嵌入以及事件参数和结构特征,并使用节点变换器和为每种类型的关系构建任务特定的动态事件图来共同提取多个事件关系,并使用多任务学习策略训练整个框架,实验证明 GraphERE 明显优于现有方法,进一步分析显示了图增强事件嵌入和共同提取策略的有效性。
Mar, 2024