Oct, 2021

ABC: 有界记忆力控制的注意力

TL;DR研究报告探讨了如何提高 Transformer 结构在处理长序列任务时的效率问题,提出了一种称为带有有限存储控制的注意力机制的抽象方法,并实现了学习性的上下文记忆优化,实验证明其可显著提高长序列任务的处理效率。