ACLJul, 2021

R2D2: 递归 Transformer 基于可微分树的可解释分层语言建模

TL;DR本文提出了一种基于递归 Transformer 模型的分层过程的方法,并将双向语言模型预训练目标扩展到此体系结构,试图预测每个单词给定其左右抽象节点。实验结果表明,我们的方法在语言建模和无监督解析方面非常有效。