Apr, 2022
MASSIVE: 一个包含 510 万个来自 51 个不同语言的多语言自然语言理解数据集
MASSIVE: A 1M-Example Multilingual Natural Language Understanding Dataset with 51 Typologically-Diverse Languages
Jack FitzGerald, Christopher Hench, Charith Peris, Scott Mackie, Kay Rottmann...
TL;DR本研究介绍了包含 51 种语言、18 种领域、60 个意图和 55 个插槽的 100 万个标注虚拟助手话语的 MASSIVE 数据集,并给出了用于其上的 XLM-R 和 mT5 模型的实验结果。