CVPRApr, 2022

Paramixer: 在稀疏因子中对混合连接进行参数化优于点积自注意力

TL;DR该研究提出了一种名为 Paramixer 的新型可伸缩和有效的混合构建模块,在比对其他注意力网络的实验结果中表现更佳,实现了将交互矩阵分解为多个稀疏矩阵的参数化,在输入序列长度为 N 时,其整体计算成本仅为 O (N log N)。