会话搜索中的词汇查询建模
本文提出了一种基于术语的方法来理解和解释查询重构操作,并使用 TREC Session Track 数据证明了该技术能够从查询日志中学习,并利用点击数据来测试用户互动行为。我们确定评估了一系列基于术语的查询重构策略,并表明我们的方法提供了有价值的洞察力,以了解会话搜索中的查询重构。
Jan, 2016
本文研究将深度神经网络模型与词汇模型相结合应用于搜索引擎的检索阶段,并在 TREC 数据集上进行了实证研究,结果表明该方法得到了很好的效果,并揭示了语义方法、词汇方法以及二者结合的不同特点。
Oct, 2020
本文研究了神经信息检索模型在词汇匹配方面的能力,提出了与 “理想” 匹配性的不一致度量,并研究了不同的最先进的神经信息检索模型的行为。结果表明,这些模型在对于重要术语时无法实现词汇匹配,从而在跨领域检索上表现不佳。
Dec, 2021
本文提出了一种基于会话的查询建议定制序列到序列模型,利用查询感知的注意机制掌握会话上下文的结构,使用复制机制赋予模型解码器存取源单词的能力,实现对于大部分之前提交查询的保留,提出了模型评估的方法以验证其性能,实验证明该模型在查询建议任务中的生成查询和评分候选查询上的优异表现。
Aug, 2017
采用编码总结、文档表示模型、词汇特征提取等方法,结合资源进行比较及潜在特征提取,实现针对法律信息提取 / 推理比赛的最优成果。
Sep, 2020
本文提出了一种使用大语言模型的通用交互式查询重写框架,旨在提高透明性和意图理解能力,并改变传统的意图理解方法;在初步实验的支撑下,通过自然语言表达、交互和推理机器意图,取得了显著的排序性能提升。
Jun, 2023
在语言建模领域中,我们探寻了多种技术的变体或极限,验证单一技术与多种技术的相互作用,将所有技术组合应用在一起,较标准的 Katz 平滑 3 元语言建模方法,我们取得了 38% 至 50% 的困惑度减少,Word 错误率降低 8.9%。
Aug, 2001
评估科学语言模型在处理短查询文本和文本邻居时的能力,并通过小扰动生成的文本邻居证明不是所有扰动都会导致嵌入空间中的接近邻居。此外,研究发现检索性能更受文本表面形式的影响,而不是文本的语义。
Mar, 2022
探究了不同的查询表示方法结合不同的检索模型对检索性能的影响,同时提出了一种基于关键词提取方法的检索模型,并通过实验表明,该方法结合传统或基于决策论的相关性模型,可以显著提高查询效果。
Jul, 2022
该论文介绍了现代搜索系统中多阶段排名管道的普遍解决方案,阐述了第一阶段检索模型的传统词项模型和语义模型之间的联系,并针对词汇不匹配问题提出了基于语义的解决思路和神经语义检索技术所带来的机遇和挑战。
Mar, 2021