May, 2023

使用音素级模型进行非流畅语音的弱监督强制对齐

TL;DR本文提出了一种基于加权有限状态转换的 CTC 模型对齐算法,通过对常见口吃现象的刻画,提高了自动语音对齐的准确性和鲁棒性。在 TIMIT 数据集和 UCLASS 数据集上的实验结果表明,该算法的召回率有了显著提高。