ACLJul, 2021

从机器翻译到代码转换:生成高质量的混合语言文本

TL;DR本文研究如何用神经机器翻译模型生成印地语 - 英语混合语种句子。通过预训练和使用合成数据来提高模型性能,生成的文本可用于数据增强,提高了语言模型任务和自然语言推理任务的性能,人工评估和客观指标的结果展现出了接近或优于印地语为母语的人群工作者生成的混合语种文本。