CORN:共训练的完全参考和非参考音频指标
本文介绍了一种名为 NoRefER 的新型无参考质量评估指标,其采用对比学习和连体网络结构,自我监督地精调跨语言语言模型以进行自动语音识别假设的点对排序以评估质量。半监督版本还使用参考数据集来改善对潜在错误样本的选择。实验结果表明,NoRefER 与基于参考的指标高度相关,具有不错的无参考 ASR 评估或 A / B 测试潜力。
Jun, 2023
本文提出了一种多语言无参考质量度量方法,使用预先训练的语言模型采用对比学习的自我监督学习方式进行微调,针对自动语音识别模型提出了一个评估标准,该评估标准可以在没有参考标记的情况下比较不同自动语音识别模型的性能,并在减少识别错误和提高性能方面效果显著。
Jun, 2023
基于广泛的实验,本研究全面评估了参考无关度量与参考度量在各种自然语言生成任务中的性能,并表明参考无关度量与人类判断有较高相关性,并对语言质量的不足更敏感,然而其有效性因任务而异,受候选文本质量影响。因此,在应用参考无关度量到新任务时,特别是在输入形式不常见或答案空间高度变化时,有必要评估其性能。本研究为自动度量的适当应用以及度量选择对评估性能的影响提供了洞察。
Mar, 2024
本文提出了一种基于深度神经网络的图像质量评估方法,通过数据驱动的方式完成特征提取、回归等过程,与现有的图像质量评估方法相比,在全参考和无参考情况下表现都更好,且不依赖手工特征或人眼视觉系统和图像统计学知识。
Dec, 2016
在自动语音识别(ASR)领域,本文介绍和评估了质量估计(QE)指标作为提高 ASR 系统中可解释人工智能(XAI)的一种新工具。通过实验和分析,探索了 NoRefER(无参考错误率)指标在识别单词级别错误方面的能力,以帮助后期编辑 ASR 假设的改进。研究还扩展到了 NoRefER 在构建数据集过程中的实用性,展示了它在增加具有深入注释的数据集方面的有效性。对 NoRefER 的诊断方面进行了检查,揭示了它提供有关模型行为和决策模式的有价值的见解的能力。这对于优先处理后期编辑工作流程和微调 ASR 模型非常有益。研究结果表明 NoRefER 不仅仅是一个错误检测工具,还是提高 ASR 系统透明性、效率和效果的全面框架。为了保证结果的可复现性,本研究的所有源代码都公开可用。
Jan, 2024
本文提出了一种针对对比度失真的简单而有效的度量标准,利用结构相似性指数 (SSIM) 、基于直方图的熵和交叉熵等方法综合评估图像质量,进而学习回归模块以预测质量得分。
Apr, 2019
提出了一种基于非对齐参考图像学习比较性知识的新框架来解决无参考图像质量评估的先天缺陷,并改进了特征提取框架以表达更丰富的质量信息,并在 8 个标准无参考图像质量评估数据集上展现了超越最先进方法的卓越性能。
Dec, 2023
无参考图像质量评估中,无监督学习的质量表示具有广泛的扭曲捕捉能力,并通过视觉语言模型提取高层次的图像质量信息,将这两组特征结合训练简单回归器有效预测质量,并展示了这些特征在数据有效和零样本情况下的优越性能。
Dec, 2023