ICCVSep, 2021

FSER: 用于语音情感识别的深度卷积神经网络

TL;DR本文介绍了使用 mel 频谱图和卷积神经网络来对八种情绪分类的 FSER 模型,经过训练在四个语音数据库中达到了 95.05%的高分类准确率。FSER 在各个基准数据集上表现最好,达到了最新的技术水平。此外,我们还描述了如何使用 FSER 来改善心理和情感保健,并发现这项工作可以作为未来研究的参考和指导。