EMNLPApr, 2020

ETC:在 Transformer 中编码长且结构化的输入

TL;DR本文介绍了一种新的 Transformer 架构 ——Extended Transformer Construction(ETC),该架构解决了标准 Transformer 架构的两个关键挑战,即扩展输入长度和编码结构化输入,并且通过将全局 - 局部注意力机制与相对位置编码以及对比预测编码(CPC)预训练目标结合使用,实现了对结构化输入的编码和处理,在需要长或结构化输入的四个自然语言数据集上取得了领先的成果。