BriefGPT.xyz
Ask
alpha
关键词
audio-visual recordings
搜索结果 - 1
MM
基于混合多模态融合的情感维度识别
本研究使用德语说话者的 Ulm-TSST 数据集,通过使用音频 - 视觉记录和生物信号特征来预测情绪唤醒和价值评估的水平,利用 LSTM 和自我注意机制来捕捉其复杂的时序依赖关系,并借助迟到融合策略进一步提高其识别性能。
PDF
3 years ago
Prev
Next