Jun, 2023

通过无监督聚类提高端到端语音识别的公平性和鲁棒性

TL;DR本文提出了使用保护隐私的方法来提高自动语音识别的公平性和鲁棒性,通过利用无监督学习从发音级别语音特征中提取得到语音聚类中心作为训练模型的额外特征,实现对任何人群的提高,特别是在不同口音情境下显示出明显改进。