Sep, 2023

人工转写质量提升

TL;DR我们提出了一种可靠的方法来收集语音转录,通过在标注阶段进行置信度估计重新处理和在标注后进行自动词错误校正来提高转录质量。我们发布了 LibriCrowd—— 一个包含 100 小时英语语音的大规模众包数据集。实验结果显示,转录错误率降低了 50% 以上。我们进一步研究了转录错误对 ASR 模型性能的影响,并发现了强相关性。转录质量的提高可以使 ASR 模型的错误率下降 10% 以上。我们将数据集和代码发布给研究社区,以造福广大研究者。