EMNLPOct, 2023

使用哨兵标记对自回归 Transformer 进行上下文压缩

TL;DR通过增量压缩指定范围的令牌的中间激活,我们提出了一种即插即用的方法,从而在处理后续上下文时减少了内存和计算成本。实验证明,与稀疏注意力基线相比,我们的方法在流畅度、n-gram 匹配和语义相似性方面具有优势。最后,我们全面评估了上下文压缩对系统改进的益处。