在频域中高效地学习算子

Nov, 2022

Transform Once: Efficient Operator Learning in Frequency Domain

Michael Poli, Stefano Massaroli, Federico Berto, Jinykoo Park, Tri Dao...

TL;DR本文介绍一种基于单个信号变换的频域学习模型，通过方差保持初始化方法和频率选择技术，可以简化模型设计，从而在各种动态系统的学习中获得更高的测试性能和更少的计算成本。

Abstract

spectral analysis provides one of the most effective paradigms for information-preserving dimensionality reduction, as simple descriptions of naturally occurring signals are often obtained via few terms of periodic basis functions. In this work, we study →

spectral analysis deep neural networks frequency-domain models variance-preserving weight initialization scheme solution operator

发现论文，激发创造

频域学习

通过在频域进行学习和频道选择，我们提出了减少冗余和显著信息以提高图像分类精度的学习方法，得出使用该方法的 ResNet-50、MobileNetV2 和 Mask R-CNN 在图像分类和实例分割上表现更好的结论。

Feb, 2020

频率导向变换的端到端优化图像压缩

基于频率导向变换的端到端图像压缩模型能够提高图像压缩性能并保持语义相容性。

Jan, 2024

深度频率导数学习用于非平稳时间序列预测

我们提出了一种基于频率导数学习的非平稳时间序列预测框架 DERITS，通过整个频率谱将时间序列进行转换，使其从频率角度充分利用数据分布，从而在时间序列预测和分布偏移方面表现出持续的优越性。

Jun, 2024

FDA: 用于语义分割的傅里叶域自适应

本论文描述了一种简单的无监督领域适应方法，通过交换低频谱来减少源和目标分布之间的差异，该方法在语义分割中实现了最新的性能，并且不需要对离散领域选择变量进行不变的神经网络背骨的敌对优化。

Apr, 2020

多元时序预测的联合时频域变换器

该研究提出了一种联合时频域变压器模型 (JTFT) 进行多元预测的方法，其中使用少量可学习的频率，利用时间序列在频域中的稀疏性来有效提取时间依赖关系，并且 JTFT 通过在时域中直接编码最近的数据点来增强局部关系的学习能力和减轻不稳定性的不利影响，该方法线性复杂度，同时采用低秩注意层来高效捕获跨维度依赖关系并提高模型性能，实验证明 JTFT 优于现有的方法。

May, 2023

频率规则化：约束卷积神经网络的信息冗余

本文提出一种名为频率正则化的方法，在频域约束网络参数的非零元素，进而可以极大程度上压缩神经网络的参数，保证网络训练的同时提高计算效率和节约存储空间。通过在多种现有神经网络架构上的实证，验证了此方法在装备有 GPU 执行引擎的嵌入式设备场景下的优越性。

Apr, 2023

频率感知深度假冒检测：通过频率空间学习改善泛化能力

通过频域学习提高深伪造图像检测器的泛化性能，包括使用频率级别的伪造检测方法和一个特定设计的频域学习模块，实现了先进的性能 (+9.8%)，并且所需参数更少。

Mar, 2024

频域多层感知机在时间序列预测中的更高学习能效

将 MLP 应用于频域的时间序列预测方法称为 FreTS，并在 13 个真实世界基准测试中展现出与现有方法相比的显著优势。

Nov, 2023

频率感知变换器用于学习图像压缩

学习图像压缩 (LIC) 已成为近年来在图像存储和传输方面的有效解决方案，然而，现有的 LIC 方法存在潜在的表示冗余问题，限制了其对各向异性频率成分和方向细节的捕捉。为了克服这些挑战，我们提出了一种新颖的频率感知变换器 (FAT) 模块，首次实现了对 LIC 的多尺度方向分析。FAT 模块由频率分解窗口注意力 (FDWA) 模块组成，用于捕捉自然图像的多尺度和方向频率成分。此外，我们引入了频率调制前馈网络 (FMFFN)，以自适应调制不同频率成分，从而改善了速率失真性能。此外，我们还提出了基于变换器的通道级自回归 (T-CA) 模型，有效地利用了通道依赖性。实验证明，与现有的 LIC 方法相比，我们的方法在速率失真性能上达到了最先进的水平，并在 Kodak、Tecnick 和 CLIC 数据集上相对于最新的标准编解码器 VTM-12.1 提高了 14.5%、15.1% 和 13.0% 的 BD - 率。

Oct, 2023

基于 GAN 的医学图像增强的频域分解转换

提出了一种新颖的频域分解转译方法（FDDT），用于医学图像转译，通过高频和低频分量的对齐来平衡图像的身份和风格信息，并在 MRI 图像和自然图像上进行了广泛的实验评估。

Nov, 2023