Jun, 2024

利用前端适应网络增强 ASR 对丢包的鲁棒性

TL;DR使用前端适应网络来恢复数据包丢失,从而提高 ASR 模型的词错误率。在包丢失场景中,基于 Whisper 准则训练的适应网络显著降低了不同领域和语言的词错误率,同时对 Whisper 模型的基础性能影响很小,凸显了该方法在挑战性声学环境中提升 ASR 模型的实用性和潜力。