利用词嵌入的深度神经网络进行查询扩展

Nov, 2018

利用词嵌入的深度神经网络进行查询扩展

Deep Neural Networks for Query Expansion using Word Embeddings

Ayyoob Imani, Amir Vakili, Ali Montazer, Azadeh Shakery

TL;DR该论文介绍了一种基于词嵌入的 query expansion 方法，使用人工神经网络分类器来预测 query expansion 词汇的有用性，实验结果表明该方法显著提高了检索性能。

Abstract

query expansion is a method for alleviating the vocabulary mismatch problem present in information retrieval tasks. Previous works have shown that terms selected for →

query expansion information retrieval word embeddings artificial neural network retrieval performance

发现论文，激发创造

利用词嵌入进行自动查询扩展

本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展（AQE）框架，通过 K 最近邻方法获得查询相关术语，并在标准 TREC ad-hoc 数据上获得显着提高。

Jun, 2016

使用本地训练的单词嵌入进行查询扩展

本文研究了词嵌入在查询扩展中的应用，结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务，建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。

May, 2016

查询预测扩展文档

该研究提出了一种将搜索引擎文档扩展为与其内容相关或代表性术语的简单方法，并利用基于 Vanilla 序列到序列模型的数据集对其进行扩展，结合高效的重新排序组件，实现了两种检索任务的最高效结果。

Apr, 2019

使用词嵌入和专业众包技术进行专利搜索的查询扩展

本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性，重点是专利、查询扩展、词嵌入、相关术语和众包模型。

Nov, 2019

个性化信息检索的词嵌入研究

本文介绍了使用 Word Embedding（word2vec）在个性化信息检索上进行查询扩展的初步工作，通过对用户档案进行学习，实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文，该方案在 CLEF Social Book Search 2016 集合上评估，结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。

Jun, 2016

事件驱动的查询扩展

本文研究了基于事件的查询扩展技术，利用新颖的词语和事件的嵌入机制在相同的向量空间中识别查询和事件之间的语义关系，进而在多个新闻文本检索数据集上显著提高检索性能。

Dec, 2020

利用维基百科和 WordNet 进行查询扩展的新方法

使用维基百科和 WordNet 作为数据源，本研究提出了一种新的查询扩展技术，并采用新的加权方案，获得 24% 的 MAP 分数和 48% 的 GMAP 分数提升。

Jan, 2019

基于注意力机制的查询扩展学习

提出一种基于自我注意力机制的模型，以更高的准确性进行查询扩展，克服现有方法的缺陷。

Jul, 2020

查询建议的关键词嵌入

本文提出了两种新颖的模型来进行关键字建议任务，使用 Word2Vec 和 FastText 的架构，通过利用文档中的关键字共现来生成关键字嵌入向量，并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外，还提供了基于排名的评估方法，对所提出的模型进行评估，并在已知项目和自由搜索场景下显示了较大的性能改进。

Jan, 2023

利用语言模型的语境线索采样进行查询扩展

本文提出了一种结合了有效过滤策略和基于上下文生成概率的检索文档融合的词汇匹配的方法，在减小索引大小的同时，提高了检索准确性；同时，在 end-to-end QA 模型中，该方法也能取得最高的 Exact-Match 分数。

Oct, 2022