Jun, 2022

在 Switchboard 基准测试上朝向零 Oracle 词错误率

TL;DR该研究探讨了在自动语音识别(ASR)研究中备受关注的‘Switchboard benchmark’数据集的一些实用考虑,并提出了修正参考转录和改变评分方法的更详细和可重复的方案。通过这种方案,甚至商业 ASR 系统的 WER 得分也可以低于 5%,研究系统的表现记录下降至 2.3%。此外,还探索了使用标准化评分工具计算 oracle WER 的方法,并比较了短语备选项表示和 utterance/word-level 的结构。最终,使用密集网络和添加字典外单词的方法实现了 0.18%的 oracle WER。