利用词嵌入的深度神经网络进行查询扩展
本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展(AQE)框架,通过 K 最近邻方法获得查询相关术语,并在标准 TREC ad-hoc 数据上获得显着提高。
Jun, 2016
本文研究了词嵌入在查询扩展中的应用,结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务,建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。
May, 2016
该研究提出了一种将搜索引擎文档扩展为与其内容相关或代表性术语的简单方法,并利用基于 Vanilla 序列到序列模型的数据集对其进行扩展,结合高效的重新排序组件,实现了两种检索任务的最高效结果。
Apr, 2019
本文介绍了使用 Word Embedding(word2vec)在个性化信息检索上进行查询扩展的初步工作,通过对用户档案进行学习,实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文,该方案在 CLEF Social Book Search 2016 集合上评估,结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。
Jun, 2016
使用维基百科和 WordNet 作为数据源,本研究提出了一种新的查询扩展技术,并采用新的加权方案,获得 24% 的 MAP 分数和 48% 的 GMAP 分数提升。
Jan, 2019
本文提出了两种新颖的模型来进行关键字建议任务,使用 Word2Vec 和 FastText 的架构,通过利用文档中的关键字共现来生成关键字嵌入向量,并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外,还提供了基于排名的评估方法,对所提出的模型进行评估,并在已知项目和自由搜索场景下显示了较大的性能改进。
Jan, 2023
本文提出了一种结合了有效过滤策略和基于上下文生成概率的检索文档融合的词汇匹配的方法,在减小索引大小的同时,提高了检索准确性;同时,在 end-to-end QA 模型中,该方法也能取得最高的 Exact-Match 分数。
Oct, 2022