Apr, 2025
广义邻域注意力:光速下的多维稀疏注意力
Generalized Neighborhood Attention: Multi-dimensional Sparse Attention
at the Speed of Light
TL;DR本研究针对现有稀疏注意力机制在速度提升上存在的不足,提出了广义邻域注意力(GNA)模型,以改善其性能表现。通过在NVIDIA Blackwell架构上实现GNA,我们的研究显示,该方法在多种情况下实现了理论上可达到的最大速度提升,并在多个生成模型上验证了28%到46%的速度加速效果,有助于应对Attention的O(n^2)复杂性问题。