Sep, 2023

利用 Whisper 增强 Hearing Aids 的多分支语音可懂度预测模型

TL;DR自动评估助听器设备中的语音可懂性非常重要。本文在以往研究基础上,提出了两种改进的模型 MBI-Net + 和 MBI-Net++,通过利用 Whisper 嵌入来增强声学特征,从而进一步提高 MBI-Net 模型的性能。实验结果表明,MBI-Net++ 和 MBI-Net + 在多项指标上均较 MBI-Net 具有更好的预测性能,而 MBI-Net++ 优于 MBI-Net+。