Sep, 2024

规范化中遗失了什么?探索多语言自动语音识别模型评估中的陷阱

TL;DR本文针对多语言自动语音识别(ASR)模型评估中的问题,尤其是印地语脚本,进行了深入研究。研究发现目前的文本规范化方法在评估印地语时存在根本性缺陷,导致性能指标被人为抬高,提出了利用本土语言专业知识发展的新规范化方案,以确保多语言ASR模型的评估更加准确和可靠。