Feb, 2024

使用预训练转换器进行文本、语音和视频的多模态情绪识别

TL;DR通过使用多模态感情识别方法和各种融合技术,本研究在 IEMOCAP 多模态数据集上实现了 75.42% 的准确率,主要关注多模态感情识别、自监督学习、迁移学习和 Transformer 模型。