Oct, 2022

自监督语音模型的探索:情感语料库研究

TL;DR本研究通过定量分析情感语料库探索了一种流行的自我监督模型 ——wav2vec 2.0,主要证明了:1)wav2vec 2.0 似乎会丢弃不太有用于词汇识别的语用信息;2)对于情感识别,只使用中间层的表示与对多个层求平均后的表示效果相当,在某些情况下,只使用最后一层的表示效果最差;3)现有的自我监督模型可能不是利用非词汇特征的下游任务的最佳解决方案,为该领域未来的研究提供新的发现和理论基础。