在频域中高效地学习算子
通过在频域进行学习和频道选择,我们提出了减少冗余和显著信息以提高图像分类精度的学习方法,得出使用该方法的 ResNet-50、MobileNetV2 和 Mask R-CNN 在图像分类和实例分割上表现更好的结论。
Feb, 2020
我们提出了一种基于频率导数学习的非平稳时间序列预测框架 DERITS,通过整个频率谱将时间序列进行转换,使其从频率角度充分利用数据分布,从而在时间序列预测和分布偏移方面表现出持续的优越性。
Jun, 2024
本论文描述了一种简单的无监督领域适应方法,通过交换低频谱来减少源和目标分布之间的差异,该方法在语义分割中实现了最新的性能,并且不需要对离散领域选择变量进行不变的神经网络背骨的敌对优化。
Apr, 2020
该研究提出了一种联合时频域变压器模型 (JTFT) 进行多元预测的方法,其中使用少量可学习的频率,利用时间序列在频域中的稀疏性来有效提取时间依赖关系,并且 JTFT 通过在时域中直接编码最近的数据点来增强局部关系的学习能力和减轻不稳定性的不利影响,该方法线性复杂度,同时采用低秩注意层来高效捕获跨维度依赖关系并提高模型性能,实验证明 JTFT 优于现有的方法。
May, 2023
本文提出一种名为频率正则化的方法,在频域约束网络参数的非零元素,进而可以极大程度上压缩神经网络的参数,保证网络训练的同时提高计算效率和节约存储空间。通过在多种现有神经网络架构上的实证,验证了此方法在装备有 GPU 执行引擎的嵌入式设备场景下的优越性。
Apr, 2023
通过频域学习提高深伪造图像检测器的泛化性能,包括使用频率级别的伪造检测方法和一个特定设计的频域学习模块,实现了先进的性能 (+9.8%),并且所需参数更少。
Mar, 2024
学习图像压缩 (LIC) 已成为近年来在图像存储和传输方面的有效解决方案,然而,现有的 LIC 方法存在潜在的表示冗余问题,限制了其对各向异性频率成分和方向细节的捕捉。为了克服这些挑战,我们提出了一种新颖的频率感知变换器 (FAT) 模块,首次实现了对 LIC 的多尺度方向分析。FAT 模块由频率分解窗口注意力 (FDWA) 模块组成,用于捕捉自然图像的多尺度和方向频率成分。此外,我们引入了频率调制前馈网络 (FMFFN),以自适应调制不同频率成分,从而改善了速率失真性能。此外,我们还提出了基于变换器的通道级自回归 (T-CA) 模型,有效地利用了通道依赖性。实验证明,与现有的 LIC 方法相比,我们的方法在速率失真性能上达到了最先进的水平,并在 Kodak、Tecnick 和 CLIC 数据集上相对于最新的标准编解码器 VTM-12.1 提高了 14.5%、15.1% 和 13.0% 的 BD - 率。
Oct, 2023
提出了一种新颖的频域分解转译方法(FDDT),用于医学图像转译,通过高频和低频分量的对齐来平衡图像的身份和风格信息,并在 MRI 图像和自然图像上进行了广泛的实验评估。
Nov, 2023