Jul, 2023

预训练模型在土耳其语语音转文本中的性能比较:Whisper-Small 和 Wav2Vec2-XLS-R-300M

TL;DR本研究使用土耳其语准备的 Mozilla Common Voice 11.0 开源数据集,对两个预训练的多语言语音到文本模型 Whisper-Small 和 Wav2Vec2-XLS-R-300M 进行性能测试和比较,WER 值分别为 0.28 和 0.16。此外,还使用呼叫中心记录准备了测试数据集以检验模型的性能。