ACLOct, 2020

使用弹性权重一致性进行神经机器翻译的无监督预训练

TL;DR本文研究了神经机器翻译中的无监督预训练方法,使用 Elastic Weight Consolidation 对双向编码器和解码器进行初始化,通过 fine-tune 来避免原始语言建模任务的遗忘,并将其与以前的正则化工作进行比较,结果表明使用这种方法可以快速收敛而且不需要原始未标记的数据。