面向任务导向对话的通用对话行为标注
本文提出一种方法,将多个公开数据集映射到 ISO 标准的子集,以创建一个大型的与任务无关的 DA 分类训练语料库,并证明使用这个语料库训练一个领域无关的 DA 标签器在跨不同 DA 类别时具有鲁棒性的重要性。
Jun, 2018
本文提出了一种名为 CDAC 的深度学习算法,通过在 Switchboard 人际对话数据集上进行预训练并在人机对话数据集上微调,实现了上下文对话行为分类,并表明采用小样本人机对话数据微调 CDAC 模型可以更精确地预测真实用户的对话行为,为未来的改进提供了有希望的方向。
May, 2020
本文提出了一种新的任务定向对话数据增强方法 TOD-DA,它包括对话丰富和口语会话模拟器,可以增加大规模高质量带注释口语会话,以提高口语任务定向对话建模的鲁棒性。在 DSTC10 Track2 的两项任务中,我们的方法均排名第一,证明了 TOD-DA 的优越性和有效性。
Dec, 2021
本文设计了一个层次结构和支持多标签的对话行为注释方案 MIDAS,针对开放领域的人机对话。为了验证该方案的适用性,我们利用迁移学习方法训练多标签对话行为预测模型,并达到了 0.79 的 F1 分数。
Aug, 2019
本文研究了利用半监督学习方法在构建神经对话系统时可以减少中间标签的数量,发现可以利用未注释数据来显著减少对话状态的转换级别注释,同时在 MultiWOZ 语料库上进行了分析并提出了第一个端到端的对话模型。
Nov, 2019
本文研究了提高生产质量的面向任务的对话系统的设计的困难,提出了使用自然语言的轻量级语义表示 —— 规范形式作为用户意图分类的替代方法,并且展现了规范形式可以很好地泛化到新的、未知的域,在零次或少次样本学习中可以轻易实现,并且可以降低开发新的任务导向的对话域的复杂性和费用。
Nov, 2022
本文介绍了一种简单而有效的数据中心方法,用于改善个性化对话代理。通过利用针对两个任务的原始 - 对偶结构(预测对话响应和个人资料之间的联系),我们增强了相关人物角色,以改进对话数据集 / 代理,并修复了基准数据集的注释问题,其巨大地增加了模型的精度,体现在 Persona-Chat 上的实验中,我们的方法在准确性上比预训练 LM 高出 11.7 个百分点。
Feb, 2022
本文提出了一种新的手动引导对话方案,其中代理从对话和手册学习任务,从而降低了对领域本体的依赖,使其更灵活地适应不同的领域,相关实验表明该方案提高了对话系统的数据效率和领域可扩展性
Aug, 2022
本文旨在构建一种统一的会话基础模型,通过收集大规模多样化的对话数据集和引入自监督任务,提高该模型的稳定性。实验结果表明,与其他相同规模的模型相比,该模型在跨领域对话任务方面有着领先的表现。
May, 2022