Mar, 2023

语音情感分析中的预训练模型表示及其对噪声的鲁棒性

TL;DR研究了预训练模型表示在情感语音识别中的应用,探讨了情感维度的表示方式,发现情感的激活度和支配力主要依赖于声学信息,而情感的价值主要依赖于词汇信息。使用多模态融合表示生成了最先进的情感识别,改进了情感估计中的准确度,发现词汇表示比声学表示更具有鲁棒性,并证明多模态模型知识蒸馏有助于提高基于声音的模型的噪声抗干扰能力。