MD3: 多方言对话数据集
本文介绍了 MMDialog 数据集、提出并规范了两个基于检索和生成场景的反应生成任务,还构建了两个基线,并提出了一种新的评估指标 MM-Relevance,用于衡量多模态反应。
Nov, 2022
本文介绍了 mDIA,这是第一个跨越低至高资源语言的大规模多语言对话生成基准。通过微调 mT5 和 DialoGPT 两种预训练模型,作者对 46 种语言中的真实对话进行了基线测试,结果表明 mT5 模型在 sacreBLEU 和 BertScore 方面表现更好,但在多样性方面表现较差。尽管在少量训练和零样本情况下表现出有希望的结果,但英语和其他语言之间的生成质量仍存在较大差距。作者希望发布 mDIA 可以促进更多有关生成多语言对话的研究,以促进语言多样性。
Aug, 2022
创造高质量的任务导向对话(ToD)的注释数据是困难的,特别是在为多种语言创造公平、文化适应性强、大规模的 ToD 数据集时面临诸多挑战。因此,现有的数据集仍然非常有限,并且存在诸多限制,如基于翻译的非母语对话、小规模或缺乏文化适应性等。在这项工作中,我们首先对多语言 ToD 数据集的现状进行了全面的梳理,提供了它们的特点和限制的系统概述。为了减少所有检测到的限制,我们推出了 Multi3WOZ,这是一个创新的多语言、多领域、多平行 ToD 数据集。它是大规模的,并且提供了四种语言的文化适应对话,以便训练和评估多语言和跨语言的 ToD 系统。我们描述了一个复杂的自下而上的数据收集过程,得到了最终的数据集,并提供了将来参考的不同 ToD 相关任务的基准分数,并突出了它具有挑战性的特点。
Jul, 2023
本文提出了 MD3 任务,通过对话猜测用户感兴趣的目标文档。通过引入包含 16,881 个文档和 13,434 个对话的新的 GuessMovie 数据集,提出了 MD3 模型,该模型通过检测文档和属性信念的发展来跟踪对话状态并最终优化对话策略,实验结果表明,该方法显着优于几个强基线方法,且与人类的表现非常接近。
Feb, 2021
本文介绍了 DailyTalk 这一高质量的会话 TTS 数据集,该数据集包含来自开放领域对话数据集 DailyDialog 的 2534 个对话,并扩展了 LST-CNN-TTS 模型,结果表明 DailyTalk 数据集可用作通用 TTS 数据集,并且基线模型可以表示 DailyTalk 中的上下文信息。
Jul, 2022
该研究提出了一个含有 7 种情感类别的中文多模态多场景多标签情感对话数据集,命名为 M3ED,用于帮助跨文化情感分析与识别,并提供了多模态上下文感知框架(MDI)以进行情感识别。
May, 2022
该研究提出了 MultiDoc2Dial,这是一个针对建模基于多个文档的目标导向对话的新任务和数据集,旨在为更真实的信息寻求对话场景提供支持,并介绍了一个新的包含来自四个不同领域的基于多个文档的对话的数据集,探索了其基于对话和文档的上下文表示,提供了强基线方法和各种实验结果,支持进一步的研究工作。
Sep, 2021
本文介绍了 MULTI3NLU++ 数据集的构建,其扩展了 NLU++ 数据集,支持跨多种语言和领域任务导向对话系统中的自然语言理解。数据集被用于对多语言语言模型、机器翻译和问题回答系统进行性能评估,表明数据集的挑战性尤其体现在低资源语言环境下。
Dec, 2022
本研究建立了两个大规模医疗对话数据集:MedDialog-EN 和 MedDialog-CN,它们分别包括英语和中文的病患与医生之间的对话,以帮助研究和开发医疗对话系统。这些数据集是迄今为止最大的医疗对话数据集。
Apr, 2020
研究了具有多种可能响应的对话,并使用多元会话数据集平衡高分歧因素 (10) 和若干次对话 (6),通过选择性分支延续。为了评估多样化生成的不同任务,我们提出了一个简单的评分算法,基于二分图匹配来最佳整合一组多样参考。最终任务是理解听众期望反应的可控制生成任务,利用文本属性从预训练分类器自动诱导多层次预测会话深度的多个语言生成任务的研究。
Feb, 2021