Jan, 2022

基于大纲生成的跨语言对话数据集构建

TL;DR本篇论文提出了一种基于大纲的多语言任务导向型对话数据集标注方法,使得多语言对话系统的数据集不再受到规模限制和翻译自然性以及文化特异性等方面的问题,设计出一组新的大规模数据集,其中的 Cross-lingual Outline-based Dialogue 数据集允许进行自然语言理解、对话状态跟踪和端到端对话建模和评估,并通过多种语言以及基于最先进技术的交叉语言对话系统对数据集进行了定量和定性分析,同时设定了参考分数以指导后续工作。