Mar, 2022

基于 Co-Attention 的多层声学信息的语音情感识别

TL;DR本文提出了一种使用新设计的共同关注机制和多层声学信息的端到端语音情感识别系统。这个系统将 MFCC、谱图和嵌入了高水平声学信息的 CNN、BiLSTM 和 wav2vec2 等多层声学信息提取出来,并使用共同关注机制融合提取出来的多模态输入。在 IEMOCAP 数据集上进行的实验表明,我们的模型具有与两种不同的跨验证策略相竞争的性能。