Jun, 2023

探索应用于紧急呼叫中心语料库的多模态情感识别的注意力机制

TL;DR本文探讨了基于 CEMO 数据集的语音和文本预训练模型在情感识别上的融合策略,研究表明基于多模态融合的交叉关注机制实现了更好的表现。同时,实验也表明在 CEMO 上,音频编码包含的情感信息比文本更为丰富。