Jun, 2023

使用基于 Wav2vec2 的口音识别模型探究语音和韵律信息

TL;DR本研究旨在通过模型探测系统层面地分析自监督学习模型在口音识别任务的微调中音素和韵律信息变化,并比较其在 Phoneme 相关性任务和预测词级韵律任务中的表现,结果表明 AID 微调任务使得自监督模型的前两层学习到了更丰富的音素和韵律表示,并且与 ASR 任务的影响有一些相似性,此外在第 9 层观察到了明显的口音特定的音素表示,总之,本研究提供了 SSL 特征以及其与微调任务之间相互作用的认识。