ECCVOct, 2022

Fast-ParC:面向卷积神经网络和 ViTs 的位置感知全局核

TL;DR本研究在计算机视觉领域中,提出了一种新的神经网络算子,名为 “位置感知循环卷积(ParC)”,通过使用全局内核和循环卷积捕捉全局特征,同时采用位置嵌入来保持位置敏感性,进一步提出了其加速版本 Fast-ParC,通过 FFT 算法将复杂度 O (n2) 的 ParC 算子的时间复杂度降至 O (nlogn),这对于生成大尺度特征映射的模型在前期阶段使用全局卷积非常有用,但是仍然保持与使用 3x3 或 7x7 卷积核的总体计算成本相当。该算子可在 ViTs 和 ConvNet 模型中使用,并在各种视觉任务中取得了有效结果,同时扩大了传统 ConvNets 的有效感受野,提高了精度。