EMNLPOct, 2022

线性变换中的魔鬼

TL;DR本文提出了一种新的线性变压器模型,称为 transNormer,以解决现有线性变压器的性能问题,通过稳定梯度和改善注意力的方式,在文本分类和语言建模任务以及 Long-Range Arena 基准测试中表现出更优异的性能,同时更加高效。