EMNLPSep, 2021

推动正确按钮:对质量评估的对抗性评估

TL;DR该论文提出了一种对机器翻译中的质量评估进行敌对测试的方法,通过研究近期最优设备的评价体系,发现某些含有意义错误的翻译结果是难以被评估系统检测的。同时,该论文还研究了翻译结果保留原本含义和改变原本含义两种扰动的区别,并探讨了这种方法对于评估系统的多个领域可能产生的影响以及评估结果可行性的可比性。