Apr, 2022

MASSIVE: 一个包含 510 万个来自 51 个不同语言的多语言自然语言理解数据集

TL;DR本研究介绍了包含 51 种语言、18 种领域、60 个意图和 55 个插槽的 100 万个标注虚拟助手话语的 MASSIVE 数据集,并给出了用于其上的 XLM-R 和 mT5 模型的实验结果。