Oct, 2023

GEMBA-MQM: 用 GPT-4 检测翻译质量错误片段

TL;DR这篇论文介绍了 GEMBA-MQM,它是一种基于 GPT 的评估指标,专门用于检测翻译质量错误,尤其适用于无需人工参考翻译的质量估计设置。基于大型语言模型(LLM)的强大能力,GEMBA-MQM 采用了固定的三步提示技术,查询 GPT-4 模型以标记错误质量范围。与以前的工作相比,我们的方法具有语言无关的提示,因此避免了为新语言进行手动提示准备。尽管初步结果表明,GEMBA-MQM 在系统排名上达到了最先进的准确性,但鉴于其依赖专有的黑盒 GPT 模型,我们建议在学术论文中谨慎使用它以展示相对于其他方法的改进。