Aug, 2023
错误中蕴藏着魔鬼的力量:利用大型语言模型进行细粒度机器翻译评估
The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation
TL;DR自动机器翻译评估是推动机器翻译系统快速迭代发展的关键工具,本文在已有单一评分指标的基础上提出AutoMQM,一种通过大语言模型的推理和上下文学习能力来识别和分类翻译错误的提示技术。通过评估最新的大语言模型PaLM和PaLM-2,通过简单的得分预测提示,发现AutoMQM在PaLM-2模型上优于仅提示得分的性能,并能提供与人工注释相一致的错误范围,具有解释性。