Feb, 2023

跨语料情感语音识别的深度隐式分布对齐网络

TL;DR本文提出了一种深迁移学习方法 DIDAN 来解决来自不同语料库的标注训练语音信号和未标注测试语音信号的交叉语料库情感识别问题。DIDAN 通过将源语音谱直接回归到情感标签来拥有情感判别能力,并利用名为隐式分布对齐(IDA)的良好设计的正则化项将其转移为适用于目标语音样本,从而使 DIDAN 可以从语音谱学习到既具有情感鉴别又具有语料库不变性的特征。广泛的交叉语料库 SER 实验表明,DIDAN 可以在处理交叉语料库 SER 任务方面优于许多最新的最先进的方法。