IntentionQA：一项评估电子商务语言模型购买意向理解能力的基准测试

Jun, 2024

IntentionQA：一项评估电子商务语言模型购买意向理解能力的基准测试

IntentionQA: A Benchmark for Evaluating Purchase Intention Comprehension Abilities of Language Models in E-commerce

Wenxuan Ding, Weiqi Wang, Sze Heng Douglas Kwok, Minghao Liu, Tianqing Fang...

TL;DR在这篇论文中，我们提出了 IntentionQA，一个双重任务多项选择问题回答基准，用于评估语言模型对电子商务中购买意图的理解能力。通过以购买的产品为基础推测意图，并利用它们预测额外的购买，LMs 被赋予了推断意图的任务。IntentionQA 包含了 4,360 个经过精心筛选的问题，涵盖了三个难度级别，使用自动化流程在大型电子商务平台上保证了可扩展性。人工评估结果表明我们的基准具有高质量和低误报率。我们的代码和数据公开在该网址。

Abstract

Enhancing language models' (LMs) ability to understand purchase intentions in e-commerce scenarios is crucial for their effective assistan

language models purchase intentions e-commerce intentionqa benchmark

发现论文，激发创造

MIND：从大型视觉 - 语言模型中蒸馏多模态购物意图以实现电子商务购买理解

利用 MIND 多模态框架，从多模态产品元数据中推断购买意向，优化用户体验和提供个性化搜索结果，进而提高大型语言模型的意向理解任务效果。

Jun, 2024

电子商务中以使用为中心的意图理解

识别和理解用户意图是电子商务的一个关键任务。本文针对预测用户意图展开研究，将意图理解视为自然语言推理任务，并独立于产品本体论。我们发现 SOTA 电子商务意图知识图 FolkScope 存在两个弱点，限制了其对用户意图的推理以及对多样有用产品的推荐能力。基于这些观察，我们引入了一个产品恢复基准，包括一种新颖的评估框架和一个示例数据集，并在该基准上进一步验证了 FolkScope 的上述弱点。

Feb, 2024

通过互动游戏背景中的意图理解研究 LLMs 的社交智能

使用新的框架 InterIntent，通过对大型语言模型进行多人游戏测试，发现虽然大型语言模型在选择意图方面表现出色，但对他人意图的推断能力较弱，与人类表现相差 20%；游戏表现与意图理解相关，强调了这四个组成部分对成功的重要性。研究强调了评估大型语言模型社交智能中意图理解的关键作用，并凸显了使用社交猜谜游戏作为复杂测试平台来提高大型语言模型评估的潜力。

Jun, 2024

电子商务对话搜索的查询跟踪：基于机器理解的视角

本文提出了利用基于自我注意力的神经网络的机器理解方法，来解决电子商务对话搜索中的查询跟踪问题，并构建了一种新的数据集，实验结果表明，该模型在精确匹配度和 F1 得分方面优于几种基线模型，展示了机器理解模型在此任务上的潜力。

Oct, 2018

电子商务查询中的意图术语选择与优化

在电子商务搜索中，通过利用历史查询重构日志，采用远程监控的方法来确定查询的产品意图，进而在搜索引擎中强调定义查询的产品意图的术语，从而改善排名。实验证明比非情境性基线更胜一筹，可以解决查询处理中出现的多种问题。

Aug, 2019

电子商务中个性化查询自动完成的搜索意图网络

现代搜索引擎的重要组成部分之一是查询自动补全（QAC），它在补充用户查询和帮助用户准确定义搜索意图方面起着关键作用。现实场景中的 QAC 系统面临两个主要挑战：意图不明确（IE）和意图转移（IT），前者使当前意图模糊不清且难以建模，后者忽略了搜索意图的转移。

Mar, 2024

网络搜索与对话代理中的用户意图推断

研究如何通过建立新模型来识别用户意图，以提高自然语言处理、查询分析、查询建议和排序等搜索引擎任务的效果。

May, 2020

使用产品元数据为对话式购物助手提供问题建议

通过使用大型语言模型（LLMs），我们提出了一个框架，可以自动生成与产品有关的上下文、有用、可回答、流畅且多样化的问题，并建议这些问题给客户作为帮助和提示，从而实现更顺畅、更快速、减少对话开销和摩擦的购物体验。

May, 2024

告诉我更多！朝着基于语言模型的代理程序的隐式用户意图理解

介绍了一种新的基准测试 Intention-in-Interaction (IN3)，用于通过明确的查询检查用户的隐含意图，提出将模型专家纳入代理设计以增强用户 - 代理之间的交互，通过 IN3 实证训练了一种强大模型 Mistral-Interact，其主动评估任务的模糊性，询问用户意图，并在启动下游代理任务执行之前对其进行细化，通过将其集成到 XAgent 框架中，全面评估了增强代理系统在用户指示理解和执行方面的性能，表明该方法在识别模糊用户任务、恢复和总结关键缺失信息、设定精确和必要的代理执行目标，以及减少冗余工具使用方面明显优于其他方法，从而提高了整体效率。所有数据和代码均已发布。

Feb, 2024

QAID: 基于问答启发的少样本意图检测

将意图识别重新定义为一个问答检索任务，通过批量对比损失采用了两阶段训练策略，提高了查询表示方法和同一意图答案间的上下文化令牌级相似度得分，最终在少样本意图识别测试上达到了最先进的性能。

Mar, 2023