理解用户：基于意图的排名数据集

Aug, 2024

理解用户：基于意图的排名数据集

Understanding the User: An Intent-Based Ranking Dataset

Abhijit Anand, Jurek Leonhardt, V Venktesh, Avishek Anand

TL;DR本研究解决了现有信息检索系统数据集缺乏查询意图的描述这一问题。通过利用先进的语言模型，提取查询的隐含意图并构造详细的语义丰富描述，增强了基准数据集的可理解性。该方法的关键发现是，改进的查询描述可以提升信息检索系统的评估和排名效果。

Abstract

As Information Retrieval systems continue to evolve, accurate evaluation and benchmarking of these systems become pivotal. Web search datasets, such as MS MARCO, primarily provide short keyword queries without accompanying intent or descriptions, posing a challenge in comprehending the

发现论文，激发创造

信息搜索对话中用户意图的分析与表征

本研究介绍了一个新的数据集，用于分析信息搜寻对话的用户意图分布、共同出现和流程模式，并利用MSDialog数据集发现了一些可用于设计对话式搜索系统的高频用户意图模式。

Apr, 2018

使用CNN和RNN从搜索查询中预测用户意图

本文采用多种嵌入方法以及循环神经网络和卷积神经网络等模型，通过基于查询的分类预测用户意图，从而实现预测用户在网站上的行为，可有效跟踪用户的意图并提供更好的用户体验。

Dec, 2018

电子商务查询中的意图术语选择与优化

在电子商务搜索中，通过利用历史查询重构日志，采用远程监控的方法来确定查询的产品意图，进而在搜索引擎中强调定义查询的产品意图的术语，从而改善排名。实验证明比非情境性基线更胜一筹，可以解决查询处理中出现的多种问题。

Aug, 2019

网络搜索与对话代理中的用户意图推断

研究如何通过建立新模型来识别用户意图，以提高自然语言处理、查询分析、查询建议和排序等搜索引擎任务的效果。

May, 2020

通过意图描述生成进行查询理解

本文提出了Query-to-Intent-Description(Q2ID)任务，利用Contrastive Generation模型CtrsGen生成自然语言intent描述，以解决IR中的搜索理解问题，通过对多个基准数据集的比较验证了模型的有效性。

Aug, 2020

QUEST：一种具有隐式集合操作的实体检索查询数据集

使用维基百科分类名，我们半自动构建了一个包含3357个自然语言查询的QUEST数据集，并用于挑战现代检索系统对于含有隐式集合操作的查询的应对能力，发现包含否定和连接的查询尤其具有挑战性。

May, 2023

大型语言模型时代的查询理解

本文提出了一种使用大语言模型的通用交互式查询重写框架，旨在提高透明性和意图理解能力，并改变传统的意图理解方法；在初步实验的支撑下，通过自然语言表达、交互和推理机器意图，取得了显著的排序性能提升。

Jun, 2023

利用大型语言模型生成、验证和应用用户意图分类

使用大型语言模型通过生成用户意图分类法来分析网页日志数据中的用户意图，以人为验证确保分类质量，并实现了一个可扩展和适应性强的方法，从搜索和聊天日志中发现用户意图的新见解。

Sep, 2023

INSTRUCTIR: 信息检索模型执行指令遵循的基准

提出一种新的基准测试模型INSTRUCTIR，专门设计用于评估信息检索任务中的指令遵循能力。通过实验分析，观察到调整了任务风格指令的检索器在性能上可能不如未调整的对照组，凸显了在构建现有的指令感知检索数据集上训练检索器时存在的过度拟合问题。

Feb, 2024

混合语义搜索：揭示用户意图超越关键词

本研究解决了传统基于关键词搜索在理解用户意图方面的局限，提出了一种新颖的混合搜索方法，结合了非语义搜索引擎、大型语言模型（LLMs）和嵌入模型的优势。该系统通过关键词匹配、语义向量嵌入和LLM生成的结构化查询，提供高相关性和上下文适切的搜索结果，显著提升了搜索的准确性和响应速度。

Aug, 2024