ACLMay, 2023

面向德语文本简化的语言模型:通过风格特定的预训练克服平行数据稀缺问题

TL;DR本文提出了一种通过在德国简单语言语料库上微调语言模型并将其作为序列到序列简化任务的解码器来克服数据稀缺性问题的两步方法,结果表明,在不同于英语的语言上进行无对齐预训练可以降低所需的平行数据量,同时提高下游任务的性能。