Oct, 2022

使用声学 CTC 损失进行迭代伪强制齐次化,以进行自监督 ASR 领域适应

TL;DR本文提出了基于自监督域适应的算法,采用迭代式伪强制对齐算法生成的对齐文本,用于定制端到端自动语音识别,并通过降低文本量或扩展对齐窗口的方法迭代计算文本对齐更新。算法精良地运用帧级字符概率、CTC 损失计算等技术,实现了对主流语音数据库的高精度音频文本对齐、领域自适应和半监督训练。