Aug, 2024
Speech-MASSIVE:用于SLU及其他领域的多语言语音数据集
Speech-MASSIVE: A Multilingual Speech Dataset for SLU and Beyond
TL;DR本研究针对缺乏大规模多语言语音理解(SLU)数据集的问题,提出了Speech-MASSIVE,一个涵盖12种语言的多语言语音数据集,并包含意图预测和槽填充任务的注释。该数据集为基础模型的评估提供了多模态和多任务支持,其显著发现是适用于多种任务的基准测试,包括语音转录和语言识别。