Dec, 2023

语音与文本情感识别器

TL;DR情感计算是一门研究领域,专注于开发能够理解、解释和响应人类情感的系统和技术。本研究主要针对公开可用的情感标签数据集稀缺和不平衡的问题,通过合并这些数据集以及采用各种语音数据增强技术构建了一个均衡的语料库,并在语音情感识别方面尝试了不同的架构。最佳系统是一个多模态的语音和基于文本的模型,相对于基准算法的性能为 157.57(不加权准确度 + 加权准确度),而基准算法的性能为 119.66。