Oct, 2020

MLQE-PE: 多语言质量估计和后编辑数据集

TL;DRMLQE-PE 为机器翻译质量评估和自动后编辑提供了新数据集,包含 11 种语言对,针对每种语言对的 10000 个翻译提供了人类标签,包括句子级别的直接评估和后编辑努力以及单词级别的好 / 坏标签,同时还提供了后编辑的句子、标题以及用于翻译文本的神经机器翻译模型。