利用词嵌入进行自动查询扩展

SIGIRJun, 2016

Using Word Embeddings for Automatic Query Expansion

Dwaipayan Roy, Debjyoti Paul, Mandar Mitra, Utpal Garain

TL;DR本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展（AQE）框架，通过 K 最近邻方法获得查询相关术语，并在标准 TREC ad-hoc 数据上获得显着提高。

Abstract

In this paper a framework for automatic query expansion (AQE) is proposed using distributed neural language model word2vec. Using semantic

automatic query expansion distributed neural language model word2vec k-nearest neighbor trec ad-hoc data

发现论文，激发创造

利用词嵌入的深度神经网络进行查询扩展

该论文介绍了一种基于词嵌入的 query expansion 方法，使用人工神经网络分类器来预测 query expansion 词汇的有用性，实验结果表明该方法显著提高了检索性能。

Nov, 2018

使用本地训练的单词嵌入进行查询扩展

本文研究了词嵌入在查询扩展中的应用，结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务，建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。

May, 2016

利用维基百科和 WordNet 进行查询扩展的新方法

使用维基百科和 WordNet 作为数据源，本研究提出了一种新的查询扩展技术，并采用新的加权方案，获得 24% 的 MAP 分数和 48% 的 GMAP 分数提升。

Jan, 2019

个性化信息检索的词嵌入研究

本文介绍了使用 Word Embedding（word2vec）在个性化信息检索上进行查询扩展的初步工作，通过对用户档案进行学习，实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文，该方案在 CLEF Social Book Search 2016 集合上评估，结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。

Jun, 2016

查询建议的关键词嵌入

本文提出了两种新颖的模型来进行关键字建议任务，使用 Word2Vec 和 FastText 的架构，通过利用文档中的关键字共现来生成关键字嵌入向量，并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外，还提供了基于排名的评估方法，对所提出的模型进行评估，并在已知项目和自由搜索场景下显示了较大的性能改进。

Jan, 2023

BERT-QE: 基于上下文的查询扩展用于文档重新排名

本论文提供了一种使用 BERT 模型选择相关文档块进行扩展的新型查询扩展模型，能够在标准 TREC Robust04 测试集上显著优于 BERT-Large 模型，有助于解决查询扩展方法引入不相关信息的问题。

Sep, 2020

基于相关性的词嵌入

本文提出两种具有不同目标函数的学习模型，用于基于查询 - 文档相关性信息学习单词表示，实验结果表明相对于 Word2vec 等基于词语相似度的模型，基于相关性的单词嵌入模型在查询扩展和查询分类等信息检索任务上具有显著优越性。

May, 2017

使用词嵌入和专业众包技术进行专利搜索的查询扩展

本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性，重点是专利、查询扩展、词嵌入、相关术语和众包模型。

Nov, 2019

使用鉴别性神经声学单词嵌入的示例查询搜索

使用神经模型将查询语音和数据库语音嵌入后进行最近邻搜索，相比模板式语音嵌入取得了更高的性能和运行效率。

Jun, 2017

将相关文档纳入 word2vec 中

本文针对词嵌入模型在信息检索任务中存在的问题及其局限性，提出了一种基于 word2vec Skip-Gram 模型的神经网络模型，通过显式向量表示的方式，增加了模型的可解释性和准确性，实现了查询词汇的局部信息融合，提高了指定任务状态下的表现表现。

Jul, 2017