Dec, 2023

emotion2vec:自监督预训练语音情感表征

TL;DR我们提出了 emotion2vec,这是一个通用的语音情感表示模型,通过自我监督在线提取方法在开源未标记的情感数据上进行预训练,结合预训练期间的话语级损失和帧级损失。emotion2vec 在主流的 IEMOCAP 数据集上,仅通过训练线性层的方式在语音情感识别任务中胜过最先进的预训练通用模型和情感专家模型。此外,emotion2vec 在 10 种不同语言的语音情感识别数据集中表现出一致的改进。emotion2vec 在其他情感任务上也展示了出色的结果,如歌曲情感识别、对话中的情感预测和情感分析。比较实验、消融实验和可视化全面展示了提出的 emotion2vec 模型的通用性。据我们所知,emotion2vec 是各种与情感相关任务中的第一个通用表示模型,填补了这一领域的空白。