会话搜索中的词汇查询建模

Aug, 2016

Lexical Query Modeling in Session Search

Christophe Van Gysel, Evangelos Kanoulas, Maarten de Rijke

TL;DR本文通过分析 TREC 会话查询日志，比较不同的词汇匹配方法以用于会话查询，并研究了在会话查询设定下词汇查询模型的可行性。作者指出，基于词频加权的朴素方法和专门的会话模型具有相当的性能表现。同时，还提出了词汇查询建模在会话搜索中的潜力和限制，并为会话搜索领域提出了未来方向。

Abstract

Lexical query modeling has been the leading paradigm for session search. In this paper, we analyze TREC session query logs and compare the performance of different →

query modeling session search lexical matching term frequency specialized models

发现论文，激发创造

基于术语的查询重构理解方法

本文提出了一种基于术语的方法来理解和解释查询重构操作，并使用 TREC Session Track 数据证明了该技术能够从查询日志中学习，并利用点击数据来测试用户互动行为。我们确定评估了一系列基于术语的查询重构策略，并表明我们的方法提供了有价值的洞察力，以了解会话搜索中的查询重构。

Jan, 2016

利用语义和词汇匹配提高文档检索系统召回率：一种混合方法

本文研究将深度神经网络模型与词汇模型相结合应用于搜索引擎的检索阶段，并在 TREC 数据集上进行了实证研究，结果表明该方法得到了很好的效果，并揭示了语义方法、词汇方法以及二者结合的不同特点。

Oct, 2020

神经信息检索中的词汇匹配研究

本文研究了神经信息检索模型在词汇匹配方面的能力，提出了与 “理想” 匹配性的不一致度量，并研究了不同的最先进的神经信息检索模型的行为。结果表明，这些模型在对于重要术语时无法实现词汇匹配，从而在跨领域检索上表现不佳。

Dec, 2021

面向基于会话的查询建议的学习注意力、复制和生成

本文提出了一种基于会话的查询建议定制序列到序列模型，利用查询感知的注意机制掌握会话上下文的结构，使用复制机制赋予模型解码器存取源单词的能力，实现对于大部分之前提交查询的保留，提出了模型评估的方法以验证其性能，实验证明该模型在查询建议任务中的生成查询和评分候选查询上的优异表现。

Aug, 2017

利用预训练词组评分模型，采用词汇匹配和摘要方法构建法律案例检索系统

采用编码总结、文档表示模型、词汇特征提取等方法，结合资源进行比较及潜在特征提取，实现针对法律信息提取 / 推理比赛的最优成果。

Sep, 2020

大型语言模型时代的查询理解

本文提出了一种使用大语言模型的通用交互式查询重写框架，旨在提高透明性和意图理解能力，并改变传统的意图理解方法；在初步实验的支撑下，通过自然语言表达、交互和推理机器意图，取得了显著的排序性能提升。

Jun, 2023

语言建模的一点进展

在语言建模领域中，我们探寻了多种技术的变体或极限，验证单一技术与多种技术的相互作用，将所有技术组合应用在一起，较标准的 Katz 平滑 3 元语言建模方法，我们取得了 38% 至 50% 的困惑度减少，Word 错误率降低 8.9%。

Aug, 2001

学术检索中语言模型的低效性：一个实验性概述

评估科学语言模型在处理短查询文本和文本邻居时的能力，并通过小扰动生成的文本邻居证明不是所有扰动都会导致嵌入空间中的接近邻居。此外，研究发现检索性能更受文本表面形式的影响，而不是文本的语义。

Mar, 2022

2021 TREC 临床试验赛道中的 UNIMIB

探究了不同的查询表示方法结合不同的检索模型对检索性能的影响，同时提出了一种基于关键词提取方法的检索模型，并通过实验表明，该方法结合传统或基于决策论的相关性模型，可以显著提高查询效果。

Jul, 2022

第一阶段检索的语义模型：一份综合回顾

该论文介绍了现代搜索系统中多阶段排名管道的普遍解决方案，阐述了第一阶段检索模型的传统词项模型和语义模型之间的联系，并针对词汇不匹配问题提出了基于语义的解决思路和神经语义检索技术所带来的机遇和挑战。

Mar, 2021