Sep, 2023

Wiki-En-ASR-Adapt:大规模英语自动语音识别定制的合成数据集

TL;DR提出一个首个大规模的公开合成数据集,用于上下文拼写检查自定义自动语音识别(ASR)中的多样罕见和词汇外(OOV)短语,如专有名词或术语。通过注入两种类型的 “困难负面” 短语到模拟的偏见列表中,我们的方法可以创建数百万个真实的损坏 ASR 假设示例,并模拟定制任务的非平凡偏见列表,同时描述了自动挖掘它们的过程。通过在提出的数据集上训练开源定制模型进行实验,我们显示出注入困难负面偏见短语可以降低 WER 和误报数目。