EMNLPOct, 2023

代码交替文本的机器翻译数据增强技术:比较研究

TL;DR在埃及阿拉伯语 - 英语混合代码生成中,我们比较了词汇替换、语言理论和回译三种流行的增强方法,通过人工评估评估了这些方法在机器翻译上的效果和增强质量。结果显示,基于回译和基于代码交替预测的词汇替换方法在两个任务中表现最佳,而在缺少代码交替并行数据的情况下,语言理论和随机词汇替换方法实现了类似的结果。