MMOct, 2021

基于混合多模态融合的情感维度识别

TL;DR本研究使用德语说话者的 Ulm-TSST 数据集,通过使用音频 - 视觉记录和生物信号特征来预测情绪唤醒和价值评估的水平,利用 LSTM 和自我注意机制来捕捉其复杂的时序依赖关系,并借助迟到融合策略进一步提高其识别性能。