面向任务型对话的多粒度知识检索

ACLMay, 2023

面向任务型对话的多粒度知识检索

Multi-Grained Knowledge Retrieval for End-to-End Task-Oriented Dialog

Fanqi Wan, Weizhou Shen, Ke Yang, Xiaojun Quan, Wei Bi

TL;DR通过引入多层级的知识检索器 MAKER 及一种新的蒸馏目标和监督信号，对话系统中的知识检索与响应生成解耦，从而有效地检索大规模的知识库。

Abstract

Retrieving proper domain knowledge from an external database lies at the heart of end-to-end task-oriented dialog systems to generate informative responses. Most existing systems blend knowledge retrieval with re

task-oriented dialog systems knowledge retrieval maker distillation objective supervision signals

发现论文，激发创造

面向任务导向对话系统的双向反馈知识检索

通过整合知识检索和回答生成，本研究提出了一种检索生成器架构，利用检索器获取相关知识并生成系统回应，并通过生成器的反馈建立检索训练标签，通过对三个基准数据集的实验结果证明了方法在任务导向对话任务中的优越性能。

Oct, 2023

端到端任务导向对话系统的检索生成对齐

利用最大边际似然方法训练感知检索器，通过利用生成回应的信号来提高生成回应的质量，并结合元知识指导生成器，以增强知识的利用能力。

Oct, 2023

知识密集型任务的多任务检索

本文介绍了一个多任务学习的神经检索模型，该模型在少样本、领域内外多种问题下表现良好，能够有效地检索到相关上下文信息，并且在多个基准测试中实现了与或优于目前的最新技术结果。

Jan, 2021

利用大型语言模型的生成式多模态知识检索

我们提出了一种创新的端到端生成框架，用于多模态知识检索，通过利用大型语言模型 (LLMs) 作为虚拟知识库，使用对象感知的前缀调优技术来指导多粒度视觉学习，将多粒度视觉特征对齐到 LLM 的文本特征空间中，通过统一格式的指令数据构建模型训练，最后，我们提出了知识引导的生成策略，在解码步骤中施加先验约束，促进独特知识线索的生成，在三个基准测试中实验证明，与强基线方法相比，在所有评估指标上均取得了 3.0% 到 14.6% 的显著改进。

Jan, 2024

开放域问答的多文档阅读器和检索器的端到端训练

提出了一种针对获取增强型开放领域问答系统的端到端可区分训练方法，它结合多个已检索文件的信息来生成答案，通过期望最大化算法的近似计算来建模检索决策，证明了该方法优于现有同类方法，达到了新的最高水平。

Jun, 2021

面向任务的对话中基于非结构化知识的高效检索增强生成

本文总结了我们在第九届对话系统技术挑战赛（DSTC 9）第一轨中的工作，我们提出了一种基于层次分类和序列嵌入的检索和生成方法，以实现针对任务导向对话中利用非结构化文本信息的回答生成。

Feb, 2021

具备实体一致性的端到端任务导向对话系统与知识库检索器

本文提出了一种新的框架，通过两个步骤查询知识库以提高生成的实体的一致性，第一步是使用 KB 检索组件检索最相关的 KB 行，以过滤 Seq2Seq 响应生成模型中的无关实体，第二步则进一步执行关注机制以解决相关的 KB 列。两种方法被提出来使训练可行，包括远程监控和 Gumbel-Softmax 技术。在两个公共数据集上进行的实验表明，我们的模型通过优于基准系统，在生成一致实体响应方面具有较好的效果。

Sep, 2019

端到端任务导向对话系统中基于约束知识库的蒸馏

论文利用基于余弦相似度的滤波技术以及辅助损失函数构建了一个新的关于任务导向型对话系统和知识库之间的信息筛选模型，并提出了一个解决现有实体 F1 指标正确性问题的新指标 multiset entity F1。实验结果表明该模型比现有的最先进模型表现更好。

Sep, 2021

基于半监督学习的面向知识检索任务的对话系统

提出一种基于检索的方法，以加强 TOD 系统中的知识选择，并结合半监督学习进行潜变量模型，该模型可以与知识检索器一起利用有标签和无标签的对话数据。实验证明，该方法在有标签和半监督设置下均优于传统的数据库查询方法。

May, 2023

从阅读器向检索器提取知识以作问答之用

本文提出了一种受到知识蒸馏启发的学习信息检索器的技术，在没有标注的查询和文档对的情况下，利用阅读器模型的注意力分数来获得检索器的合成标签，用于下游任务，最终在问题回答方面达到了最先进的结果。

Dec, 2020