COLINGMar, 2024

JMultiWOZ:一个大规模的多领域任务导向对话日语数据集

TL;DR为了推动日语任务导向对话系统的研究和发展,本研究构建了 JMultiWOZ,这是第一个规模较大的多领域任务导向对话数据集。通过使用 JMultiWOZ 评估英语基准数据集 MultiWOZ2.2 和最新的大型语言模型 (LLM) 方法的对话状态跟踪和响应生成能力,评估结果表明 JMultiWOZ 与 MultiWOZ2.2 具有相当的水平。此外,通过与模型和人类参与者进行交互对话的评估实验,我们发现日语中 LLMs 在任务完成能力上存在局限性。