Nov, 2023

面向可推广 SER 的软标注和数据增强:建模大规模多语种语音中的情绪时序变化

TL;DR通过合并多个语料库,提出了一种软标签系统来识别口语交流中的情感,并使用时间动力学强调情感的动态变化。通过在跨语言的四个多语种数据集上进行验证,展示了引人注目的零 - shot 泛化性能。