ICMLApr, 2022

线性复杂度随机自注意力机制

TL;DR本文提出了一种基于自归一化重要性采样器的线性随机化注意力机制,结合了随机特征关注性的表达性和计算效率,能够以线性时间和空间复杂度近似整个 softmax 注意力,与随机特征关注性相比,具有很大的性能优势。