ACLJun, 2022

长度自适应平均滞后策略在同声传译中的应用:不能奖励过度生成

TL;DR本文提出了一种新的评估指标 LAAL(Length-Adaptive Average Lagging),并且指出了传统的评估指标 AL(Average Lagging)对于长文本预测的系统评估得分存在低估的问题,同时讨论了当前的 SimulST 系统普遍存在的过度生成(over-generation)问题。该新指标可以提供一种无偏差的评估方法,适用于同时语音翻译领域中既有低生成又有高生成的系统。