MMJul, 2022

ComParE 2022 口吃子挑战赛的端对端和自监督学习

TL;DR本文提出了基于自监督学习的语音嵌入系统,通过对预先训练的 Wav2Vec2.0 模型进行嵌入提取,结合 Mel 频率倒谱系数 (MFCC) 特征进行评估,在计算语言学竞赛中达到了较好的结果,相对于 DeepSpectrum 挑战基线提高了 31.32% (验证集) 和 1.49% (测试集)。同时,通过对 Wav2Vec2.0 的各层嵌入进行求和,进一步提高了系统性能。