Sep, 2023

基于声学语言模型预训练的端到端语音识别和流畅性修正

TL;DR基于最近在大规模音频预训练方面的成功,我们重新评估两阶段和端到端模型之间的性能比较,并发现使用弱自监督目标进行音频预训练的语音模型与类似训练的两阶段模型的性能相匹配或超过,而预训练目标的选择显著影响模型适应去除启动词任务的能力。