ECCVSep, 2022

Hydra Attention: 多头注意力的高效实现

TL;DR介绍了一种针对大型图像的高效注意力操作 ——Hydra Attention,使用的多头注意力与特征数一样多,与元素数量和特征数量成线性关系,比现有的 self-attention 更快,同时在 ImageNet 数据集上保持了高准确性。