Mar, 2023

MuAViC: 一个用于稳健语音识别和文本翻译的多语言音视频语料库

TL;DRMuAViC 是首个开放的多语言视听数据集,共提供了 1200 小时覆盖 9 种语言的视听数据,可应用于嘈杂环境下的语音识别和翻译模型构建。