Jun, 2017

基于注意力卷积神经网络的语音情感识别:输入特征、信号长度和演讲语音影响的研究

TL;DR本文介绍了使用具有多视角学习目标函数的关注卷积神经网络进行语音情感识别的实验研究,对比了不同输入信号长度、不同类型的声学特征和不同类型的情感语音 (即兴 / 编剧) 对系统表现的影响,结果显示,除了输入特征选择外,模型的性能强烈依赖于语音数据类型,进一步实现了 IEMOCAP 上即兴语音数据的最优结果。