Nov, 2022

FsaNet: 频率自注意力在语义分割中的应用

TL;DR通过对图像的频谱特性的研究,我们提出了一个高度降低计算复杂度的自注意机制。通过在不同频段上的个性化处理,可以更好地保留边缘,并在对象内提高相似性。我们设计并嵌入新的插入式模块到 CNN 网络的头部,称为 FsaNet。通过低频自注意力的应用,相对于全频,我们显示可以实现非常接近或更好的性能。相比其他基于 ResNet101 的自注意网络,FsaNet 在 Cityscape 测试数据集上取得了新的最优结果(83.0%mIoU),在 ADE20k 和 VOCaug 上取得了竞争性的结果。