BriefGPT.xyz
Ask
alpha
关键词
bidirectional language model pre-training
搜索结果 - 1
ACL
R2D2: 递归 Transformer 基于可微分树的可解释分层语言建模
本文提出了一种基于递归 Transformer 模型的分层过程的方法,并将双向语言模型预训练目标扩展到此体系结构,试图预测每个单词给定其左右抽象节点。实验结果表明,我们的方法在语言建模和无监督解析方面非常有效。
PDF
3 years ago
Prev
Next