ACLSep, 2021

无穷记忆 Transformer

TL;DR本文提出了一种无限长期记忆的 Transformer 神经网络,使用连续空间的注意机制来处理过长的信息序列,实现了对长序列的信息保持和处理。