Jan, 2024

基于注意机制的无参考度量进行语音识别质量评估,实现高效语料采样和后期编辑

TL;DR在自动语音识别(ASR)领域,本文介绍和评估了质量估计(QE)指标作为提高 ASR 系统中可解释人工智能(XAI)的一种新工具。通过实验和分析,探索了 NoRefER(无参考错误率)指标在识别单词级别错误方面的能力,以帮助后期编辑 ASR 假设的改进。研究还扩展到了 NoRefER 在构建数据集过程中的实用性,展示了它在增加具有深入注释的数据集方面的有效性。对 NoRefER 的诊断方面进行了检查,揭示了它提供有关模型行为和决策模式的有价值的见解的能力。这对于优先处理后期编辑工作流程和微调 ASR 模型非常有益。研究结果表明 NoRefER 不仅仅是一个错误检测工具,还是提高 ASR 系统透明性、效率和效果的全面框架。为了保证结果的可复现性,本研究的所有源代码都公开可用。