Feb, 2018
基于深度多模态学习的口语情感识别
Deep Multimodal Learning for Emotion Recognition in Spoken Language
Yue Gu, Shuhong Chen, Ivan Marsic
TL;DR本文提出了一种新颖的深度多模态框架,基于句子级别的口语语言预测人类情感,通过混合式的深度多模态结构从文本和音频中提取高级特征,再使用三层深度神经网络将所有特征融合起来进行训练,实现整个结构的最优全局微调,结果表明本文框架在 IEMOCAP 数据集上达到了 60.4% 的加权准确率。