MMApr, 2021

Earnings-21: 野外 ASR 的实用基准

TL;DR本文提出了一个 39 小时的包含来自不同金融领域的密集实体语音的 Earnings-21 语料库,用于 ASR 系统的基准测试,并针对命名实体识别进行特殊关注。通过我们最近发布的 fstalign 工具,提供了每个模型在不同划分下的识别能力的坦率分析。分析发现,某些 NER 类别的 ASR 准确率很低,存在着显著的文本理解和使用障碍。Earnings-21 能够评估学术和商业 ASR 系统,使得实体塑造和 WER 在真实世界音频上的进一步研究成为可能。