使用本地训练的单词嵌入进行查询扩展

May, 2016

使用本地训练的单词嵌入进行查询扩展

Query Expansion with Locally-Trained Word Embeddings

Fernando Diaz, Bhaskar Mitra, Nick Craswell

TL;DR本文研究了词嵌入在查询扩展中的应用，结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务，建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。

Abstract

Continuous space word embeddings have received a great deal of attention in the natural language processing and machine learning communiti

word embeddings natural language processing machine learning ad hoc information retrieval term relatedness

发现论文，激发创造

利用词嵌入的深度神经网络进行查询扩展

该论文介绍了一种基于词嵌入的 query expansion 方法，使用人工神经网络分类器来预测 query expansion 词汇的有用性，实验结果表明该方法显著提高了检索性能。

Nov, 2018

个性化信息检索的词嵌入研究

本文介绍了使用 Word Embedding（word2vec）在个性化信息检索上进行查询扩展的初步工作，通过对用户档案进行学习，实现了个性化的词嵌入学习以获取和用户兴趣相同的上下文，该方案在 CLEF Social Book Search 2016 集合上评估，结果表明在个性化信息检索上应对 Word Embedding 应用进行一些努力。

Jun, 2016

将相关文档纳入 word2vec 中

本文针对词嵌入模型在信息检索任务中存在的问题及其局限性，提出了一种基于 word2vec Skip-Gram 模型的神经网络模型，通过显式向量表示的方式，增加了模型的可解释性和准确性，实现了查询词汇的局部信息融合，提高了指定任务状态下的表现表现。

Jul, 2017

基于相关性的词嵌入

本文提出两种具有不同目标函数的学习模型，用于基于查询 - 文档相关性信息学习单词表示，实验结果表明相对于 Word2vec 等基于词语相似度的模型，基于相关性的单词嵌入模型在查询扩展和查询分类等信息检索任务上具有显著优越性。

May, 2017

利用词嵌入进行自动查询扩展

本文提出了一种利用分布式神经语言模型 word2vec 的自动查询扩展（AQE）框架，通过 K 最近邻方法获得查询相关术语，并在标准 TREC ad-hoc 数据上获得显着提高。

Jun, 2016

探索词语和关系的理论表示

该研究提出了一种理论方法，将词嵌入和知识图谱中的实体及其关系的几何形状联系起来，以便更好地理解它们的语义结构和性能。

Feb, 2022

使用词嵌入和专业众包技术进行专利搜索的查询扩展

本文在 11 个不同的技术领域研究了词嵌入和众包模型的有效性，重点是专利、查询扩展、词嵌入、相关术语和众包模型。

Nov, 2019

使用通用和特定词嵌入来分类研究的翻译阶段

本文探讨使用无监督学习的方法，通过单词嵌入在词向量空间内学习语义相似性，以实现对文本分类任务的性能优化。研究发现，使用领域特定的词嵌入可以提高分类性能。

May, 2017

全球思考，本地嵌入 --- 单词的本地线性元嵌入

提出一种无监督的本地线性元嵌入学习方法，使用预先训练好的分布式词嵌入生成更准确的元嵌入，表现优于该领域现有技术，建立新的元嵌入技术的最先进状态。

Sep, 2017

查询建议的关键词嵌入

本文提出了两种新颖的模型来进行关键字建议任务，使用 Word2Vec 和 FastText 的架构，通过利用文档中的关键字共现来生成关键字嵌入向量，并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外，还提供了基于排名的评估方法，对所提出的模型进行评估，并在已知项目和自由搜索场景下显示了较大的性能改进。

Jan, 2023