May, 2024

朝着端到端可解释的卷积神经网络发展音波信号

TL;DR用卷积神经网络构建高效且可解释的端到端音频深度学习模型,通过在三个标准语音情感识别数据集上的实验验证,我们的框架在效率和可解释性方面表现优越,对抗 Mel 频谱特征有高达 7% 的改进;还揭示了前端层在处理复杂的长波形模式方面的高效性和可解释性,通过 PhysioNet 心音数据库的实例进行了论证,为处理原始波形数据构建了可移植的有效模型解决方案。