Aug, 2022

MDIA:46 种语言多语对话生成的基准

TL;DR本文介绍了 mDIA,这是第一个跨越低至高资源语言的大规模多语言对话生成基准。通过微调 mT5 和 DialoGPT 两种预训练模型,作者对 46 种语言中的真实对话进行了基线测试,结果表明 mT5 模型在 sacreBLEU 和 BertScore 方面表现更好,但在多样性方面表现较差。尽管在少量训练和零样本情况下表现出有希望的结果,但英语和其他语言之间的生成质量仍存在较大差距。作者希望发布 mDIA 可以促进更多有关生成多语言对话的研究,以促进语言多样性。