Dec, 2020

全新如初:成功回收英文GPT-2制作其他语言模型

TL;DR本文提出了一种方法,将英语GPT-2模型通过重新训练词汇嵌入,适应意大利语和荷兰语,并通过增加复杂性来生成与原始英文嵌入对齐的意大利语和荷兰语词汇嵌入。该方法最大程度地减少了训练量,并且防止了在适应过程中由GPT-2学习的信息丢失,这使得英语GPT-2模型可以生成逼真的意大利语和荷兰语句子。虽然平均而言,这些句子仍然可被人们认为是人造的,但是它们与从头训练的GPT-2模型生成的句子相媲美。