该论文介绍了一种基于词嵌入的 query expansion 方法,使用人工神经网络分类器来预测 query expansion 词汇的有用性,实验结果表明该方法显著提高了检索性能。
Nov, 2018
本文介绍了使用 Word Embedding(word2vec)在个性化信息检索上进行查询扩展的初步工作,通过对用户档案进行学习,实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文,该方案在 CLEF Social Book Search 2016 集合上评估,结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。
Jun, 2016
本文针对词嵌入模型在信息检索任务中存在的问题及其局限性,提出了一种基于 word2vec Skip-Gram 模型的神经网络模型,通过显式向量表示的方式,增加了模型的可解释性和准确性,实现了查询词汇的局部信息融合,提高了指定任务状态下的表现表现。
Jul, 2017
本文提出两种具有不同目标函数的学习模型,用于基于查询 - 文档相关性信息学习单词表示,实验结果表明相对于 Word2vec 等基于词语相似度的模型,基于相关性的单词嵌入模型在查询扩展和查询分类等信息检索任务上具有显著优越性。
May, 2017
本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展(AQE)框架,通过 K 最近邻方法获得查询相关术语,并在标准 TREC ad-hoc 数据上获得显着提高。
该研究提出了一种理论方法,将词嵌入和知识图谱中的实体及其关系的几何形状联系起来,以便更好地理解它们的语义结构和性能。
Feb, 2022
本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性,重点是专利、查询扩展、词嵌入、相关术语和众包模型。
Nov, 2019
本文探讨使用无监督学习的方法,通过单词嵌入在词向量空间内学习语义相似性,以实现对文本分类任务的性能优化。研究发现,使用领域特定的词嵌入可以提高分类性能。
提出一种无监督的本地线性元嵌入学习方法,使用预先训练好的分布式词嵌入生成更准确的元嵌入,表现优于该领域现有技术,建立新的元嵌入技术的最先进状态。
Sep, 2017
本文提出了两种新颖的模型来进行关键字建议任务,使用 Word2Vec 和 FastText 的架构,通过利用文档中的关键字共现来生成关键字嵌入向量,并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外,还提供了基于排名的评估方法,对所提出的模型进行评估,并在已知项目和自由搜索场景下显示了较大的性能改进。
Jan, 2023