面向任务的对话中基于非结构化知识的高效检索增强生成

Feb, 2021

面向任务的对话中基于非结构化知识的高效检索增强生成

Efficient Retrieval Augmented Generation from Unstructured Knowledge for Task-Oriented Dialog

David Thulke, Nico Daheim, Christian Dugast, Hermann Ney

TL;DR本文总结了我们在第九届对话系统技术挑战赛（DSTC 9）第一轨中的工作，我们提出了一种基于层次分类和序列嵌入的检索和生成方法，以实现针对任务导向对话中利用非结构化文本信息的回答生成。

Abstract

This paper summarizes our work on the first track of the ninth Dialog System Technology Challenge (DSTC 9), "Beyond Domain APIs: Task-oriented Conversational Modeling with unstructured knowledge access". The goal of the task is to generate responses to user turns in a →

发现论文，激发创造

基于检索增强的生成模型用于知识密集型自然语言处理任务

探索一种以维基百科作为参数内存和通过神经检索器访问的显式非参数内存的 pre-trained 具有差异访问机制的 RAG 模型，它可用于在广泛的与知识有关的 NLP 任务中取得 state-of-the-art 的表现。

May, 2020

面向任务对话系统的实体感知知识检索与生成响应的复制机制学习

本文描述利用预训练语言模型及粗层次知识信息进行基于任务的对话建模，实现对话历史和知识访问的响应生成，并在模型最终输出的基础上进行后处理策略以进一步提升知识应用，在客观指标下获得第二名，在人类指标下获得第四名的实验结果。

Dec, 2020

DSTC9中基于任务的对话建模与非结构化知识访问跟踪的超越领域API

任务驱动的对话系统使用外部非结构化知识源来扩展任务领域API的覆盖范围，三个任务包括知识寻找、选择和响应生成，并用集成方法和大规模预训练语言模型取得了高性能。

Jan, 2021

可以提供进一步帮助吗？使用非结构化知识访问来改善任务导向的对话建模

本研究针对限定领域API的局限性，采用一种基于查询-选择-回应的方法，引入了外部非结构化知识资源，通过对话上下文信息的提取和增强实现了对超出API覆盖范围用户请求的响应，并在DSTC9 Track 1基准数据集上实现了全自动和人工评估的最优性能，验证了我们的贡献的有效性。

Jun, 2021

TegTok：通过任务特定和开放世界知识增强文本生成

通过引入任务特定和开放世界知识（TegTok）进一步改善文本生成的性能，该方法可以在 PLMs 上学习如何更好地生成对话和问题。

Mar, 2022

通过无监督联合建模的查询增强知识密集型对话

本文提出了一个名为QKConv的无监督查询改进方法，它在对话型问题回答，任务导向型对话和知识驱动型对话方面相对于无监督方法实现了最先进的性能，与监督方法相比具有竞争性的性能。

Dec, 2022

端到端任务导向对话系统的检索生成对齐

利用最大边际似然方法训练感知检索器，通过利用生成回应的信号来提高生成回应的质量，并结合元知识指导生成器，以增强知识的利用能力。

Oct, 2023

面向任务导向对话系统的双向反馈知识检索

通过整合知识检索和回答生成，本研究提出了一种检索生成器架构，利用检索器获取相关知识并生成系统回应，并通过生成器的反馈建立检索训练标签，通过对三个基准数据集的实验结果证明了方法在任务导向对话任务中的优越性能。

Oct, 2023

UniRQR: 一个统一的模型用于互联网基础知识对话系统中的检索决策、查询和回复生成

知识对话系统与互联网检索近年来吸引了研究人员的广泛关注。通过使用统一的模型实现检索决策、查询生成和回复生成的三个任务，我们的工作不仅解决了使用外部知识的必要性问题，还节约了多模型部署的复杂性和成本。在Wizint和Dusinc数据集上的实验证明了我们的统一模型在各个任务上的卓越性能，以及与针对每个任务单独部署的SOTA系统相比具有可比性的结果。

Jan, 2024

UniMS-RAG: 个性化对话系统的统一多源检索增强生成模型

利用统一多源检索增强生成系统UniMS-RAG，综合三个子任务：知识源选择、知识检索和回复生成，通过训练在序列到序列模型中自适应地检索证据和评估相关性，实现了个性化回复生成，并在两个个性化数据集上展示了其最新的性能。

Jan, 2024