Sep, 2022

自动后编辑的实证研究

TL;DR该研究针对自动后编辑(APE)中数据稀缺的情况,通过数据增强的方式来生成大规模人工语料库构建人工数据域,以提高模型性能,报告表明高质量的人工语料库与生成的训练数据可以改善模型性能,同时在不同 MT 系统中 APE 的难度不同,模型在语法和语义添加问题上的表现良好,但容易出现实体和语义省略错误。