BriefGPT.xyz
Oct, 2020
MLQE-PE: 多语言质量估计和后编辑数据集
MLQE-PE: A Multilingual Quality Estimation and Post-Editing Dataset
HTML
PDF
Marina Fomicheva, Shuo Sun, Erick Fonseca, Frédéric Blain, Vishrav Chaudhary...
TL;DR
MLQE-PE为机器翻译质量评估和自动后编辑提供了新数据集,包含11种语言对,针对每种语言对的10000个翻译提供了人类标签,包括句子级别的直接评估和后编辑努力以及单词级别的好/坏标签,同时还提供了后编辑的句子、标题以及用于翻译文本的神经机器翻译模型。
Abstract
We present
mlqe-pe
, a new
dataset
for Machine Translation (MT) Quality Estimation (QE) and
automatic post-editing
(APE). The
→