ICLRNov, 2015

从语音中学习情感表现

TL;DR本文探讨运用去噪自编码器来学习从语音中分离出言语内容以外的语调特征,实现从语音中学习情感的判别,包括基于时间窗口的快速傅里叶变换和梅尔频率倒谱系数等不同的输入方法和不同的自编码器结构,结果显示学习到的表示具备与优秀的特征提取器相当的能力。