May, 2023

Vistaar: 用于印度语音识别的多元基准和训练集

TL;DR本文提出了 Vistaar,59 个受试语言和领域组合的基准,用于评估和改进三个公开的 ASR 系统和两个商业系统,同时使用 IndicWhisper 通过在 12 种印度语言上进行微调,在 Vistaar 基准中明显改善了考虑到的 ASR 系统。