Feb, 2023
评估自动语音识别在增量式场景中的性能
Evaluating Automatic Speech Recognition in an Incremental Setting
Ryan Whetten, Mir Tahsin Imtiaz, Casey Kennington
TL;DR本文通过系统评估六种语音识别器的性能并提出了两种方法用于流式语音识别,并提出了新的指标用于评估增量识别。研究发现,本地识别器通常更快,需要更新的次数较少,并且 Meta 的 Wav2Vec 模型是最快的,Mozilla 的 DeepSpeech 模型在其预测中最稳定。