面向任务导向对话的通用对话行为标注

Jul, 2019

面向任务导向对话的通用对话行为标注

Towards Universal Dialogue Act Tagging for Task-Oriented Dialogues

Shachi Paul, Rahul Goel, Dilek Hakkani-Tür

TL;DR本文提出了一种适用于任务导向对话系统的通用 DA 模式，并使用人类 - 人类对话语料库进行标记和建模，通过半监督学习技术，以提高标记效率和标记质量。

Abstract

machine learning approaches for building task-oriented dialogue systems require large conversational datasets with labels to train on. We are interested in building →

machine learning task-oriented dialogue systems universal da schema annotated datasets semi-supervised learning

发现论文，激发创造

面向会话代理的 ISO 标准领域无关的对话行为标记

本文提出一种方法，将多个公开数据集映射到 ISO 标准的子集，以创建一个大型的与任务无关的 DA 分类训练语料库，并证明使用这个语料库训练一个领域无关的 DA 标签器在跨不同 DA 类别时具有鲁棒性的重要性。

Jun, 2018

面向开放域对话代理的上下文对话行为分类

本文提出了一种名为 CDAC 的深度学习算法，通过在 Switchboard 人际对话数据集上进行预训练并在人机对话数据集上微调，实现了上下文对话行为分类，并表明采用小样本人机对话数据微调 CDAC 模型可以更精确地预测真实用户的对话行为，为未来的改进提供了有希望的方向。

May, 2020

针对口语对话理解数据的低成本 LLM 注释研究

自动增强口语对话语料库中的语义表示的研究，评估了大型语言模型微调的相关性、生成注释所捕捉的知识，以及半自动注释的影响。

Jun, 2024

TOD-DA: 从口语会话中提高任务导向对话建模的鲁棒性

本文提出了一种新的任务定向对话数据增强方法 TOD-DA，它包括对话丰富和口语会话模拟器，可以增加大规模高质量带注释口语会话，以提高口语任务定向对话建模的鲁棒性。在 DSTC10 Track2 的两项任务中，我们的方法均排名第一，证明了 TOD-DA 的优越性和有效性。

Dec, 2021

MIDAS：面向开放域人机口语对话的对话行为注释方案

本文设计了一个层次结构和支持多标签的对话行为注释方案 MIDAS，针对开放领域的人机对话。为了验证该方案的适用性，我们利用迁移学习方法训练多标签对话行为预测模型，并达到了 0.79 的 F1 分数。

Aug, 2019

面向任务建模的对话状态跟踪的半监督引导

本文研究了利用半监督学习方法在构建神经对话系统时可以减少中间标签的数量，发现可以利用未注释数据来显著减少对话状态的转换级别注释，同时在 MultiWOZ 语料库上进行了分析并提出了第一个端到端的对话模型。

Nov, 2019

面向任务导向对话的领域自适应 Prompt 学习

本文研究了提高生产质量的面向任务的对话系统的设计的困难，提出了使用自然语言的轻量级语义表示 —— 规范形式作为用户意图分类的替代方法，并且展现了规范形式可以很好地泛化到新的、未知的域，在零次或少次样本学习中可以轻易实现，并且可以降低开发新的任务导向的对话域的复杂性和费用。

Nov, 2022

改进角色感知对话数据集的双重任务框架

本文介绍了一种简单而有效的数据中心方法，用于改善个性化对话代理。通过利用针对两个任务的原始 - 对偶结构（预测对话响应和个人资料之间的联系），我们增强了相关人物角色，以改进对话数据集 / 代理，并修复了基准数据集的注释问题，其巨大地增加了模型的精度，体现在 Persona-Chat 上的实验中，我们的方法在准确性上比预训练 LM 高出 11.7 个百分点。

Feb, 2022

面向灵活对话代理的手动引导对话

本文提出了一种新的手动引导对话方案，其中代理从对话和手册学习任务，从而降低了对领域本体的依赖，使其更灵活地适应不同的领域，相关实验表明该方案提高了对话系统的数据效率和领域可扩展性

Aug, 2022

DFM: 用于大规模对话导向任务学习的对话基础模型

本文旨在构建一种统一的会话基础模型，通过收集大规模多样化的对话数据集和引入自监督任务，提高该模型的稳定性。实验结果表明，与其他相同规模的模型相比，该模型在跨领域对话任务方面有着领先的表现。

May, 2022