May, 2022

评估端到端生成系统的字幕分割

TL;DR研究字幕分割在使用不同于参考文本的输出时的评估方法,提出一种基于边界上的 BLEU 得分的字幕分割得分 $Sigma$。通过边界投影方法,将输出错误的假设映射到真实参考上,比较已有指标和 $Sigma$。研究结果表明,所有指标都能奖励高质量输出,但系统排名取决于每个指标对错误类型的敏感度,$Sigma$ 是一种有前途的分割候选者,但它与其他分割指标的可靠性仍需通过与人类判断相关性的验证来证实。