Mar, 2025

在机器翻译中加入巧克力以减轻度量干扰

TL;DR本研究针对在模型开发中使用相同或相关度量导致的度量干扰问题(Mud),提出了MintAdjust方法以提高评估的可靠性。研究发现,度量干扰会严重扭曲实例级别的度量分数,从而导致对系统性能的过度乐观估计。MintAdjust方法在WMT24机器翻译共享任务的测试集上优于现有最先进的度量,特别是在高质量系统中显示出更高的准确性。