本文研究将深度神经网络模型与词汇模型相结合应用于搜索引擎的检索阶段,并在 TREC 数据集上进行了实证研究,结果表明该方法得到了很好的效果,并揭示了语义方法、词汇方法以及二者结合的不同特点。
Oct, 2020
本文研究基于嵌入的推荐系统应用于大规模的招聘场景,提出融合不同级别的文本、语义实体和位置信息的嵌入式聚类方法构建 Faiss 索引来支持候选人检索,最终运用二阶段模型完成了在线招聘匹配系统,并取得了显著的成功。
Jul, 2021
此论文讲述了如何通过挖掘 LinkedIn 中的各种数据源以推断搜索者的意图,并将同构概念扩展到许多方面以捕捉搜索者 - 结果的相似之处,然后通过学习排名(LTR)来将这些信号与标准搜索特征相结合,从而实现 LinkedIn 搜索的深度个性化。
May, 2016
本文研究了深度学习在 LinkedIn 人才搜索和推荐系统中的应用,利用神经网络模型学习人才搜索领域中的稀疏实体的语义表示,利用学习排名方法来提升人才搜索、推荐系统的表现。
Sep, 2018
本文提出了利用轻量级的推理,将 re-ranker 的命中率反馈给 retriever 的方法,从而提高检索召回率。实验证明,此方法在多个领域、语言和模态下均明显提高了检索召回率。
May, 2023
本文提出了一个使用知识库和特性来增强 JD / 简历匹配过程的系统,旨在提供公正,可解释和可追溯的体系结构。
Feb, 2022
本篇论文提出三个方面的方法,包括新的模型架构、IR 导向的预训练任务、生成大规模训练数据,以解决神经检索器面临的问题,并探讨了多模式查询的未来研究方向和相应的解决方法。
May, 2022
信息检索一直是信息检索研究的重点之一。近年来,提出了 Dense Retrieval(DR)技术来缓解诸如词汇不匹配问题等固有缺陷,但是绝大多数现有 DR 模型的培训都依赖于从语料库中抽样负实例来优化成对损失函数,即不公平的样本,因此提出了 Learning To Retrieve(LTRe)培训技术, 它通过预先构建文档索引,并在每个培训迭代中在没有负样本采样的情况下执行全检索,从而在整个语料库中检索相关文档,实验表明,LTRe 在有效性方面明显优于所有有竞争力的稀疏和密集基线。它甚至在合理的延迟限制下比 BM25-BERT 级联系统表现更好。
使用 NLP 和多模式学习,该论文介绍了如何通过搜索引擎检索来增强预训练模型,从而在测试时从互联网中检索到有用的数据,并更新模型以解决模型的不确定性,取得了零样本性能的显著改进。
Nov, 2023
该研究提出了一种基于实体建模的候选实体检索范式,该范式首先将 Wikidata 实体及其文本字段索引到文本搜索引擎中,再使用序列到序列模型生成目标实体的摘要,从而查询已索引的搜索引擎以检索候选实体,最后结合交叉注意力重新排序器,实现了在三个基于 Wikidata 的数据集上的最先进效果和在 TACKBP-2010 上的强劲表现的高度有效的混合方法候选实体检索和实体链接框架。