Jul, 2022

语音情感:探究模型表达、多任务学习和知识蒸馏

TL;DR本研究探讨利用预训练的声学模型,将词汇信息融合到声学语音信号中,以改善情感估计,特别是情感维度中的愉悦度估计,并且发现预训练的模型嵌入融合可比标准声学特征基线(Mel 滤波器的能量)产生更好的效果,且经测试可以推广到其他数据集上。