频率自适应扩张卷积用于语义分割
本研究提出了一种用于改善高频和多尺度特征学习的动态卷积算法,其中采用了增强空间上下文信息的核生成模块 (SEKG) 以及动态卷积块 (DCB) 和多尺度动态卷积块 (MDCB)。此外,还提出了多维特征集成 (MFI) 机制,旨在融合多尺度特征,从而提供具有精确性和丰富上下文特征的表征。最终,使用所提出的算法构建的 ADFNet 在真实世界和合成高斯噪声数据集上取得了更好的性能,且具有较低的计算复杂度。
Nov, 2022
本文提出了一种自适应分数膨胀卷积(AFDC)方法,采用图像宽高比嵌入、保持组成以及无需额外参数的方式在卷积内核层面处理图像宽高比信息,通过使用最近两个整数膨胀卷积核内插可以解决分数采样对齐问题;并提供了迷你批量训练的简洁公式,并利用分组策略来减少计算开销。实验结果表明,该方法在 AVA 数据集上的图像美学评估方面达到了最先进的性能。
Apr, 2020
本文提出了 FreConv 模块,用于利用数据集中包含的频率信息来增强网络的性能,并在各种任务中实验结果表明,装备了 FreConv 的网络始终优于现有的基线模型。
Apr, 2023
通过在频域进行学习和频道选择,我们提出了减少冗余和显著信息以提高图像分类精度的学习方法,得出使用该方法的 ResNet-50、MobileNetV2 和 Mask R-CNN 在图像分类和实例分割上表现更好的结论。
Feb, 2020
CNN 模型易受到对抗攻击的脆弱性为安全关键应用的部署带来了担忧,本研究通过在频域中构建空间频率图层来探讨 CNN 模型的脆弱性,通过广泛的实验观察到空间频率 CNN 模型在白盒和黑盒攻击下比常规 CNN 模型更加稳健,此外,发现低频成分对空间频率 CNN 模型的鲁棒性有重大贡献,这些发现将有助于未来设计更加鲁棒的 CNN 模型。
May, 2024
通过频域学习提高深伪造图像检测器的泛化性能,包括使用频率级别的伪造检测方法和一个特定设计的频域学习模块,实现了先进的性能 (+9.8%),并且所需参数更少。
Mar, 2024
提出一种双流卷积神经网络框架,其中一流在频域中适应四个可学习频率滤波器来学习特征,另一流利用 RGB 图像来补充频域特征,通过分层注意力模块进行信息融合,提升面部呈现攻击检测方法的泛化能力。
Sep, 2021
FALCON 是一种单图像去雾系统,利用频域操作来扩大感知范围,通过连续密度掩模来处理大气散射模型,具备在实时应用领域(如自动驾驶)中获得最新性能的能力。
Jul, 2024
本文设计了以 Fast Fourier convolution 为核心的神经网络结构,用于语音增强,实验证实大的接受域使其优于普通卷积模型,并展示结果强于或与其他语音增强基线相当。
Apr, 2022