Aug, 2023

利用深度学习技术捕捉语音情感识别的频谱和长时标语境信息

TL;DR本研究提出了一种综合模型,将图卷积网络(GCN)用于处理文本数据并利用 HuBERT 变换器分析音频信号,通过结合 GCN 和 HuBERT 模型,同时分析多模态数据并融合这些模态,提高了情感识别系统的辨别能力。