网络搜索中基于事件的查询扩展

ACLMay, 2023

Event-Centric Query Expansion in Web Search

Yanan Zhang, Weijie Cui, Yangfan Zhang, Xiaoling Bai, Zhe Zhang...

TL;DR本文提出了一种新的查询扩展系统 Event-Centric Query Expansion（EQE），通过从大量的潜在事件中挖掘最佳扩展，快速准确地提高搜索质量，该系统已被部署在腾讯 QQ 浏览器搜索中，服务于数亿用户。

Abstract

In search engines, query expansion (QE) is a crucial technique to improve search experience. Previous studies often rely on long-term search log mining, which leads to slow updates and is sub-optimal for time-sensitive news searches. In this work, we present Event-Centric →

query expansion event-centric query expansion news search semantic retrieval tencent qq browser search

发现论文，激发创造

信息检索的查询扩展技术：一项调查

本文探讨了从 1960 年至 2017 年信息检索中的查询扩展技术，包括核心技术、数据源、加权和排名方法、用户参与以及应用，揭示了其相似性和差异性。

Aug, 2017

事件驱动的查询扩展

本文研究了基于事件的查询扩展技术，利用新颖的词语和事件的嵌入机制在相同的向量空间中识别查询和事件之间的语义关系，进而在多个新闻文本检索数据集上显著提高检索性能。

Dec, 2020

利用维基百科和 WordNet 进行查询扩展的新方法

使用维基百科和 WordNet 作为数据源，本研究提出了一种新的查询扩展技术，并采用新的加权方案，获得 24% 的 MAP 分数和 48% 的 GMAP 分数提升。

Jan, 2019

在基于问答的事件提取中迈向更好的问题生成

通过利用强化学习方法，我们提出了四个评估问题质量的标准，并在基于问题回答的事件提取中生成了流畅、具有概括性和上下文相关性的问题，从而为 QA 模型提供了明确的指导。在 ACE 和 RAMS 数据集上进行的广泛实验证实了我们方法的有效性，同时也展示了它在训练数据有限的情况下的鲁棒性。

May, 2024

基于众包知识的代码搜索查询扩展

利用众包知识的查询扩展方法，结合 Rocchio 模型提出了一种技术 (QECK Rochhio)，能够有效地提高代码搜索效率，实验结果显示此方法的准确率和 NDCG 在三个代码搜索算法中分别提高了 64％和 35％，而与最先进的查询扩展方法相比，其提高 22％的准确率和 16％的 NDCG。

Mar, 2017

BERT-QE: 基于上下文的查询扩展用于文档重新排名

本论文提供了一种使用 BERT 模型选择相关文档块进行扩展的新型查询扩展模型，能够在标准 TREC Robust04 测试集上显著优于 BERT-Large 模型，有助于解决查询扩展方法引入不相关信息的问题。

Sep, 2020

Web 搜索中的事件驱动实时检索

本文研究信息检索在实时搜索中面临的挑战，通过整合事件信息和查询，利用跨注意力机制实现时间背景的查询表示，通过多任务训练增强事件表示能力，以及通过两阶段训练和硬负采样进行模型优化，并通过实验证明本方法在时间敏感场景下显著优于现有基线方法。

Dec, 2023

语音助手系统中的查询扩展和实体加权查询重构检索

本文提出了一种新的查询扩展和实体加权方法，利用实体目录中的实体关系改进查询重构性能，实验发现该方法相比不使用查询扩展和加权的基准模型，特别是在前 10 个结果中，精度有 6% 的提高，在使用查询扩展和加权的其他基准模型中，精度有 5% 以上的提高。

Feb, 2022

使用大型语言模型进行语料导向的查询扩展

运用大语言模型生成的查询扩展可以显著增强信息检索系统，但由于模型的知识有限，导致扩展与检索语料库之间存在错位、产生幻觉和过时信息等问题。为了解决这些挑战，本文提出了基于语料库导向的查询扩展方法，利用大语言模型的相关性评估能力系统地识别初始检索文档中的关键句子，并将这些基于语料库的文本与大语言模型扩展的结果一起用于查询扩展，从而提高查询和目标文档之间的相关性预测。通过广泛的实验证明，该方法在没有任何训练的情况下表现出强大的性能，尤其适用于大语言模型缺乏知识的查询。

Feb, 2024

利用词嵌入进行自动查询扩展

本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展（AQE）框架，通过 K 最近邻方法获得查询相关术语，并在标准 TREC ad-hoc 数据上获得显着提高。

Jun, 2016