Dec, 2023

情感多模态病理语音数据库的设计、构建与评估

TL;DR构建了第一个包含多视角信息的中文多模态情感病理性言语数据库,标记了 29 个对照组和 39 个不同程度运动性言语障碍患者表达快乐、悲伤、愤怒和中性情绪的情感言语,并通过精确度、言语可懂性、价值 - 唤醒空间分布和 SCL-90 与疾病严重程度之间的相关性等主观分析来验证其有效性。在语音和声门数据上进行的自动识别表明,对于对照组的音频,平均准确率为 78%,对于患者为 60%;对于声门数据,对照组为 51%,患者为 38%,表明疾病对情感表达的影响。