EMNLPSep, 2021

PermuteFormer:用于长序列的高效相对位置编码

TL;DR本文讨论了如何将相对位置编码添加到 Performer 模型中,提出了一种基于 Performer 模型的相对位置编码的模型 PermuteFormer。在长序列数据集 Long-Range Arena 和语言建模数据集 WikiText-103 中进行的实验证明,PermuteFormer 几乎没有计算开销,并且在大多数任务上优于基于 Vanilla Transformer 的 Performer 的性能。