Nov, 2022

带有动态 Token 池化的高效 Transformer

TL;DR通过动态 Pooling 和自回归机制,使得 Transformer 模型在其计算资源内的表现更快更准确。