Jan, 2024

普通话多模态情感语音数据库的构建与评估

TL;DR设计并建立了一个包括发音运动学、声学、声门和面部微表情的多模态情感汉语数据库,描述了从语料库设计、被试选择、录音细节和数据处理等方面的详细信息。通过对维度注释数据的统计分析验证了维度注释的有效性。使用支持向量机、卷积神经网络和深度神经网络计算了这七种情感的识别率,结果显示仅使用声学数据识别七种情感的平均识别率约为 82%。因此,该数据库具有高质量,可用作重要的语音分析研究来源,特别是用于多模态情感语音分析任务。