Jan, 2024

HAAQI-Net:适用于助听器的非侵入式神经音乐质量评估模型

TL;DR介绍了 HAAQI-Net,一种针对助听器用户定制的非侵入式深度学习模型,用于音乐质量评估。相比传统方法如 HAAQI(Hearing Aid Audio Quality Index),HAAQI-Net 利用注意力机制的双向长短时记忆(BLSTM)。它采用了来自音频转换器(BEATs)的预训练的双向编码器表示进行声学特征提取。通过与真实数据进行对比,HAAQI-Net 实现了 0.9257 的纵向一致相关系数(LCC),0.9394 的斯皮尔曼等级相关系数(SRCC)和 0.0080 的均方误差(MSE)。值得注意的是,这种高性能伴随着推理时间的大大缩短:从 62.52 秒(HAAQI)到 2.71 秒(HAAQI-Net),为助听器用户提供高效的音乐质量评估模型。