ACLMar, 2022

Transformer 语法:在规模上增强具有语法归纳偏见的转换语言模型

TL;DRTransformer Grammars 是一种新颖的语言模型,通过特殊的注意力掩码和确定性转换实现递归句法组合,提高了句子级别和句法敏感的语言建模性能,在长文本建模中,递归的句法组合对表示整个句子向量造成了瓶颈并影响了逼近度,表明一个独立于组合句法表示的不同类型的记忆机制在当前成功的模型中发挥了重要作用。