Oct, 2022

不借助类别标注训练语音情感分类器

TL;DR本研究旨在研究情感表示的两种范式:分类标签和连续空间中的维度描述,并提出一种仅使用维度标注的分类流程。该方法基于回归器模型,可以预测给定语音音频的维度表示的连续值向量,进而使用映射算法将其解读为情感类别。我们研究了三种特征提取器,三种神经网络结构和三种映射算法在两个不同的语料库上的绩效。研究表明,分类回归方法具有优势和局限性。