Jan, 2024

揭示讲话者嵌入中的情感聚类:对话音频情感识别的对比学习策略

TL;DR研究表明说话者嵌入包含有关情感的有价值信息,因此在情感识别中,利用有限的标记数据,说话者嵌入有潜力成为一种有前途的资源。通过进行彻底的聚类分析,研究人员发现了情感与最先进的说话者嵌入之间的直接且有用的联系。为了利用这些信息,他们引入了一种新颖的对比预训练方法,基于说话者嵌入的类内聚类样本来进行情感无标签数据的预训练,取得了显著的情感识别性能改善。