Aug, 2024

面向包容性和公平语音识别的口音语音聚类和挖掘

TL;DR本研究针对现代自动语音识别系统在对少数口音的识别能力不足的问题,提出了口音聚类和挖掘方案,以实现公平的语音识别。通过监督或无监督预训练、分布鲁棒优化和无监督聚类等方法,显著提高了对小样本口音语音的识别性能,特别是在对印度口音的微调中,分别实现了10.0%和5.3%的相对提升。