Jun, 2022

AHD ConvNet 语音情绪分类

TL;DR本文提出了一种新的基于孪生网络的 mel 频谱学习方法,用于从 CREMA-D 数据集中的 wav 形式的语音记录中学习情感,所提出的模型使用对数 mel - 频谱图作为特征,mels 数量为 64,在情感语音识别的问题上,相对于其他方法,本方法所需的训练时间更短。