Jan, 2022
粤语自动语音识别数据集:调查与新数据集
Automatic Speech Recognition Datasets in Cantonese: A Survey and New Dataset
Tiezheng Yu, Rita Frieske, Peng Xu, Samuel Cahyawijaya, Cheuk Tung Shadow Yiu...
TL;DR本研究利用多领域广泛覆盖的香港粤语语料库 (MDCC),采用多数据集学习技术提高 Fairseq S2T Transformer 自动语音识别模型在香港粤语方言中的有效性。