Oct, 2021

探索 Wav2vec 2.0 微调以提高语音情绪识别

TL;DR该研究介绍了使用不同的微调策略,将 Wav2Vec 2.0 应用在语音情感识别上,从而进一步提高其性能,最终成功达到了在 IEMOCAP 数据集上的最新状态下的表现,升高 7.4% 的绝对无权重准确率,同时提出了一种上下文化情感表示的微调方法 “P-TAPT”。