Jun, 2024
希腊播客语料库:用弱监督数据训练低资源语言的竞争性语音模型
The Greek podcast corpus: Competitive speech models for low-resourced languages with weakly supervised data
Georgios Paraskevopoulos, Chara Tsoukala, Athanasios Katsamanis, Vassilis Katsouros
TL;DR通过使用弱监督方法构建大规模语料库,本研究在语音技术方面证实了通过增加数据量和模型规模来提高 ASR 性能的成效,进一步推动了资源匮乏语言的语音技术发展。