Sep, 2023

从有缺陷的数据中学习:弱监督的自动语音识别

TL;DR使用 Omni-temporal Classification(OTC)训练自动语音识别(ASR)模型,可以有效地学习语音文本对齐并适应训练文本中的错误,从而避免在包含高达 70% 错误的文本情况下出现性能下降,与 CTC 模型完全失败的情况不同。