该论文介绍了一种基于词嵌入的 query expansion 方法,使用人工神经网络分类器来预测 query expansion 词汇的有用性,实验结果表明该方法显著提高了检索性能。
Nov, 2018
本文研究了词嵌入在查询扩展中的应用,结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务,建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。
May, 2016
使用维基百科和 WordNet 作为数据源,本研究提出了一种新的查询扩展技术,并采用新的加权方案,获得 24% 的 MAP 分数和 48% 的 GMAP 分数提升。
Jan, 2019
本文介绍了使用 Word Embedding(word2vec)在个性化信息检索上进行查询扩展的初步工作,通过对用户档案进行学习,实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文,该方案在 CLEF Social Book Search 2016 集合上评估,结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。
Jun, 2016
本文提出了两种新颖的模型来进行关键字建议任务,使用 Word2Vec 和 FastText 的架构,通过利用文档中的关键字共现来生成关键字嵌入向量,并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外,还提供了基于排名的评估方法,对所提出的模型进行评估,并在已知项目和自由搜索场景下显示了较大的性能改进。
Jan, 2023
本论文提供了一种使用 BERT 模型选择相关文档块进行扩展的新型查询扩展模型,能够在标准 TREC Robust04 测试集上显著优于 BERT-Large 模型,有助于解决查询扩展方法引入不相关信息的问题。
Sep, 2020
本文提出两种具有不同目标函数的学习模型,用于基于查询 - 文档相关性信息学习单词表示,实验结果表明相对于 Word2vec 等基于词语相似度的模型,基于相关性的单词嵌入模型在查询扩展和查询分类等信息检索任务上具有显著优越性。
May, 2017
本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性,重点是专利、查询扩展、词嵌入、相关术语和众包模型。
Nov, 2019
使用神经模型将查询语音和数据库语音嵌入后进行最近邻搜索,相比模板式语音嵌入取得了更高的性能和运行效率。
Jun, 2017
本文针对词嵌入模型在信息检索任务中存在的问题及其局限性,提出了一种基于 word2vec Skip-Gram 模型的神经网络模型,通过显式向量表示的方式,增加了模型的可解释性和准确性,实现了查询词汇的局部信息融合,提高了指定任务状态下的表现表现。
Jul, 2017