视频表示学习的频率选择性增强

AAAIApr, 2022

Frequency Selective Augmentation for Video Representation Learning

Jinhyung Kim, Taeoh Kim, Minho Shim, Dongyoon Han, Dongyoon Wee...

TL;DR本文提出了一种基于频域的时空数据增强方法，称为 FreqAug，可以在吸收视频信息的过程中减少对静态信息的偏好，以更好地学习视频表示，并在五个视频动作识别和两个时间动作定位下游任务上表现出一致的改进。

Abstract

Recent self-supervised video representation learning methods focus on maximizing the similarity between multiple augmented views from the same video and largely rely on the quality of generated views. However, most existing methods lack a mechanism to prevent representation learning fr

self-supervised learning video representation learning data augmentation spatio-temporal frequency domain

发现论文，激发创造

FrAug: 时域预测的频率域增强技术

本文提出了一种名为 FrAug 的频率域增强方法，以改善时间序列预测模型的精度，并且也能够在数据量少和分布变化时发挥作用。

Feb, 2023

面向时间序列预测的多样性和连贯性增强

本文提出了一种结合了谱分解和时间分解的数据增强方法，可用于预测型时间序列数据的生成，实验表明该方法在五个真实的数据集上均取得了比其他基准模型和增强方法更好的表现。

Mar, 2023

利用傅里叶基函数填补增强间隙：重新思考图像分类中的频率增强

在这篇论文中，我们提出了一种称为辅助傅立叶基扩充（AFA）的补充技术，它针对频域扩充，填补了视觉扩充留下的扩充间隙。我们通过傅立叶基加性噪声在直接且高效的对抗设置中展示了扩充的效用。我们的结果表明，AFA 有助于模型对常见破坏、OOD 泛化以及对于逐渐增加的扰动模型性能的一致性的鲁棒性，而对于模型的标准性能则无明显损害。它可以与其他扩充技术无缝集成，进一步提升性能。

Mar, 2024

频率感知深度假冒检测：通过频率空间学习改善泛化能力

通过频域学习提高深伪造图像检测器的泛化性能，包括使用频率级别的伪造检测方法和一个特定设计的频域学习模块，实现了先进的性能 (+9.8%)，并且所需参数更少。

Mar, 2024

HybridAugment++: 模型鲁棒性的统一频谱扰动

卷积神经网络（CNN）在分布变化下展现出较差的泛化性能，通过基于频率的角度考虑人类与 CNN 可能会关注图像的不同频率成分，我们提出了一种简单而有效的数据增强方法 HybridAugment 来降低 CNN 对高频成分的依赖，从而提高它们的鲁棒性并保持良好的准确性。同时，我们还提出了基于层次结构的增强方法 HybridAugment++，它在 HybridAugment 的基础上减少了 CNN 对图像振幅成分的依赖，并更加注重相位信息。这种统一的方法在干净准确度（CIFAR-10/100 和 ImageNet）、损坏数据集（ImageNet-C、CIFAR-10-C 和 CIFAR-100-C）、对抗鲁棒性（CIFAR-10）和数据集外分布检测等方面达到了与或优于最先进的结果。HybridAugment 和 HybridAugment++ 仅需几行代码实现，不需要额外数据、集成模型或其他网络。

Jul, 2023

FilterAugment: 一种声学环境数据增强方法

提出了一种名为 FilterAugment 的数据增强方法，用于在不同声学环境下正则化音频模型。通过在频率带上应用不同的权重，这种方法可以模拟声学滤波器，从而使模型能够从更广泛的频率区域提取相关信息。实验证明，与频率屏蔽相比，FilterAugment 在声音事件检测性能方面的提升为 6.50％，在说话人验证方面取得了 1.22％的等误率。

Oct, 2021

频域学习

通过在频域进行学习和频道选择，我们提出了减少冗余和显著信息以提高图像分类精度的学习方法，得出使用该方法的 ResNet-50、MobileNetV2 和 Mask R-CNN 在图像分类和实例分割上表现更好的结论。

Feb, 2020

可组合增强编码用于视频表示学习

研究自监督视频表示学习中的对比方法，提出一种考虑数据增强变量的对比学习框架，以提高针对时间信息进行的微粒视频动作识别的性能，并在多个视频基准测试中达到最先进水平。

Apr, 2021

对抗攻击的频域模型增强

本文提出了一种新的频域模拟攻击方法，通过将频域变换应用于输入，从而实现模型扩充，旨在打造更易传递的对抗样本，结果表明这种方法对攻击 9 个最先进防御模型具有较高的成功率。

Jul, 2022

探究时空多频分析用于实现高保真度和时空一致性的视频预测

本文提出基于多级小波分析的视频预测网络，以应对图像失真和时间不一致等现有预测模型所存在的问题，大量实验结果表明，本方法相较其他最先进的方法，具有更高的保真度和时间一致性。

Feb, 2020