相位匹配用于样本外泛化
本文研究使用图像的相位与幅度谱对于卷积神经网络在图片分类中的作用,发现使用相位谱能使网络更加稳健,利用此结论我们设计了新的数据增强方法并在多项测评中取得了最优结果。
Aug, 2021
本文提出了一种基于傅里叶的领域泛化新视角,通过开发一种称为幅度混合的新型傅里叶数据增强策略,来强制模型捕获高级语义信息,同时在原始图像与增强图像之间引入了一种双重一致性损失方法,取得了领域泛化的最新成果并显著提高了性能。
May, 2021
本研究通过对卷积神经网络进行频率数据增强,提出了基于分量的对抗训练方法,成功实现了对不同类型干扰包括对抗性干扰的通用鲁棒性,这有助于提升神经网络对图像扰动的抵抗力。
May, 2023
本文提出了一种有效的相位重建策略,可以在嘈杂的环境中操作,通过将相位连续性损失考虑在最先进的神经语音增强系统中,本文证明了我们所提出的方法在训练过程中,可以显著提高增强语音信号的质量。
Feb, 2022
本文研究了图像数据的频谱与卷积神经网络(CNN)的泛化行为之间的关系,揭示了 CNN 捕获高频率组件的能力,提出与 CNN 泛化行为相关的多个假设,并探讨了 CNN 在鲁棒性与准确性之间的平衡及训练启发式的一些证据。
May, 2019
该研究提出了一种基于语义的混合策略(SAM)来解决深度神经网络在遇到未知目标域时的泛化问题,在傅里叶谱的启示下,SAM 将混合策略应用于傅里叶相位和振幅信息,有效地提高了图像分类任务的准确性。
Apr, 2023
本研究提出了一种称为 PADDLES 的方法,通过使用离散傅里叶变换(DFT)将某些层的特征分解为振幅谱(AS)和相位谱(PS),在训练期间分别在不同的时间点停止 AS 和 PS 的训练,以提高 CNNs 对标签噪声的鲁棒性。在合成和现实标签噪声数据集上,PADDLES 的表现超过了其他早期停止方法,并实现了最先进的性能。
Dec, 2022
本文提出了一种利用空间图像和相位谱相结合的 SPSL 方法,以捕捉人脸伪造的上采样伪影并提高可转移性,通过减少感受野来抑制高级特征,专注于本地区域的人脸伪造检测方法,并对利用相位谱的有效性进行了理论分析,在交叉数据集评估中实现了最先进的性能,并在单个数据集评估中获得可比较的结果。
Mar, 2021
基于我们观察到的非稳态统计与相位信息的内在联系,我们提出了一种时间序列学习框架 PhASER,包括相位增强、分离特征编码、特征广播等元素,以增强学习模型对不同分布的泛化能力,通过在人类活动识别、睡眠阶段分类和手势识别等 5 个数据集上的广泛评估,我们证明 PhASER 相对于现有基线方法平均提高了 5% 的性能,在某些情况下提高了 13%,此外,PhASER 的原则可以广泛应用于提升现有时间序列分类模型的泛化能力。
Feb, 2024