Aug, 2024

LAHAJA:评估印地语自动语音识别系统的多口音基准

TL;DR本研究针对印地语自动语音识别(ASR)系统在多口音下评估的不足,提出了LAHAJA基准,包含了来自132名讲者的12.5小时各种主题的印地语音频。研究发现,基于多语言和良好讲者多样性的训练模型显著优于现有模型,并指出在北东和南印度讲者的表现尤其较差,特别是在涉及命名实体和专业术语的内容中。