May, 2023

非母语流畅度评分的音素和韵律感知自监督学习方法

TL;DR本文提出了一种基于自监督学习的方法,利用大量未标注语音和文本提示进行预训练,然后再进行有人工评分的微调,以更好地评估语音流畅性 / 不流畅性。实验结果表明,该方法在 Pearson 相关系数方面优于基线系统,并且通过消融实验来更好地理解音素和韵律因素在预训练阶段的贡献。