IJCAIJun, 2020

CoSDA-ML: 多语言混码数据增强用于零样本跨语言自然语言处理

TL;DR提出了一种数据增强框架以生成多语言混合数据来微调多语言 - BERT 模型,从而实现将源语言和多个目标语言的表示进行对齐,相较现有方法,该方法无需依赖双语句子进行训练,并且只需一个训练过程即可对多个目标语言进行微调,对于 19 种语言的五项任务表现均明显提高。