May, 2024

DEPTH:分层预训练的议程教育

TL;DR深度是一个编码器 - 解码器模型,通过在预训练过程中引入面向语篇的目标来提高语言模型在语篇层面上的理解能力。通过结合层次化的句子表示和两个目标:句子重排和跨度破坏,深度能够更快地学习语义和语篇级别的表示,从而拓展了 T5 在语篇能力方面的表现。