Nov, 2023
面向可推广 SER 的软标注和数据增强:建模大规模多语种语音中的情绪时序变化
Towards Generalizable SER: Soft Labeling and Data Augmentation for Modeling Temporal Emotion Shifts in Large-Scale Multilingual Speech
Mohamed Osman, Tamer Nadeem, Ghada Khoriba
TL;DR通过合并多个语料库,提出了一种软标签系统来识别口语交流中的情感,并使用时间动力学强调情感的动态变化。通过在跨语言的四个多语种数据集上进行验证,展示了引人注目的零 - shot 泛化性能。