- 关于利用 DCT 统计量进行裁剪检测的探索
通过离散余弦变换 (DCT) 导出的频率成分的研究已被广泛应用于图像分析。最近观察到这些成分可以对图像的生命周期提供重要信息,但尚无研究专注于它们与图像的源分辨率之间的分析。本研究调查了一种新的图像分辨率分类器,该分类器采用 DCT 统计数 - 动态频谱混合器用于视觉识别
提出了一种自适应结构,名为动态谱混合器(DSM),该结构通过使用离散余弦变换在频域表示标记间的相互作用,能够以对数线性复杂度学习长期空间依赖性,并通过动态频谱权重生成层实现信息频段的突出,从而高效地学习包含高低频信息的视觉输入的详细特征。全 - 神经网络架构学习傅里叶变换、信号处理和更多
通过在 AI 和神经架构的最新进展中采用傅里叶变换,本研究报告将探索和回答有关此过程的基本问题。进一步地,我们展示了如何通过学习从头开始的神经架构,为音频信号处理应用程序学习这些内核,并发现神经架构不仅可以学习正弦内核形状,还可以发现各种令 - ENN:一种带有 DCT 自适应激活函数的神经网络
该研究提出了一种新的神经网络架构 - Expressive Neural Network (ENN),其中非线性激活函数使用离散余弦变换 (DCT) 建模,并在训练过程中使用反向传播进行自适应,实现了较高的灵活性和表现力,同时可以适应不同的 - 基于空间频率和 DCT 域一致性验证的多焦点图像融合
该研究提出了一种将多重焦点图像融合在无线视觉传感器网络中的算法,该算法利用离散余弦变换标准来确定融合标准,利用空间频率和一致性验证过程提高输出图像质量,并在多对多重焦点图像上进行测试,结果显示提高了输出图像的视觉质量并超越了其他基于 DCT - 可解释的频谱转换攻击对说话人识别的影响
通过将输入语音进行 MDCT 处理,并轻微修改不同频带的能量,该文提出了一个名为 STA-MDCT 的通用框架,该框架不仅能够在黑盒受害者模型中提高对抗声音的可转移性,而且能够实现梯度攻击,并使用模型集成来进一步提高攻击效果并通过类激活映射 - FECAM: 时间序列预测的频率增强通道注意机制
本研究提出了一种新的频率增强通道注意力机制,可以自适应地建模通道之间的频率相互依赖关系,避免傅里叶变换中出现的问题性周期性引起的高频噪声,目的是改善当前主流网络的预测能力,并显示出良好的性能。
- 回到 MLP:人体动作预测的简单基线
本研究提出了一种轻量级的人体运动预测网络 “siMLPe”,结合了多层感知器、离散余弦变换、关节残差位移预测和速度辅助损失优化等简单方法,且具有仅有 0.14 万个参数和超过三个基准数据集的卓越表现,成为该领域的强基准。
- CVPR探索基于频率对抗性攻击的人脸造假检测
本文提出了一种基于离散余弦变换(DCT)的频率对抗攻击方法,以欺骗面部伪造检测器。通过引入融合模块来捕获对手在频率域中显着的区域,我们的方法比空间域中的现有对抗攻击更为难以察觉,并且不会降低原始图像的视觉质量。在实验中,我们发现该方法有效地 - ICLR在压缩权重空间中训练和生成神经网络
本文旨在探讨使用离散余弦变换对循环神经网络的权重矩阵进行编码的方法,以提高算法的可扩展性和效率,并在 enwik8 数据集上进行了实验。
- 学习 JPEG 压缩伪迹用于图像篡改检测和定位
通过使用卷积神经网络 (CNN) 和离散余弦变换 (DCT) 系数,本文提出了一种用于本地化检测图像篡改的方法,并介绍了 Compression Artifact Tracing Network (CAT-Net)。CAT-Net 与传统方 - DCT-Mask:离散余弦变换蒙版表示实例分割
本研究提出了一种新的掩模表示方法 DCT-Mask,通过在高分辨率二进制网格掩模中应用离散余弦变换编码成紧凑向量,进而容易地融入大多数基于像素的实例分割方法,并在不同框架、主干网络、数据集和训练时间表上仅仅稍有改进。
- 基于 DFT-DCT 和阿诺德变换的混合盲鲁棒图像水印技术
提出了一种鲁棒的盲水印图像处理方法,通过将离散傅里叶变换(DFT)和离散余弦变换(DCT)相结合,并使用 Arnold 变换(AT)对水印进行增强,实现了在保持高不可察觉性的同时,提高了数码图像的版权保护能力。
- EMNLP利用离散余弦变换进行高效句子嵌入
本论文提出了使用离散余弦变换 (DCT) 压缩以保持顺序的单词序列来代替向量平均法进行句子嵌入。与向量平均法相比,这种方法更好地保留了句法信息,从而在与句法相关的分类任务中表现更好。
- MM探索基于 DCT 表示的语义分割
本文提出了一种在离散余弦变换(DCT)表示上执行语义分割的方法,通过重新排列 DCT 系数以形成首选输入类型,并针对 DCT 输入量调整现有网络来实现。该方法的准确性接近于 RGB 模型,在网络复杂性相当的情况下,适当选择 DCT 分量可以 - 谐波网络:将频谱信息整合到 CNN 中
本文提出谐波块代替传统的卷积层,通过学习离散余弦变换定义的谱滤波器的最优组合来产生特征,将谐波块引入现有卷积神经网络基线模型,可以在小的 NORB,CIFAR10 和 CIFAR100 数据集的分类任务中取得与或更好的性能。
- 隐式双域卷积网络用于强鲁棒性彩色图像压缩伪影减少
本文提出了隐式双域卷积网络 (IDCN),该网络利用了像素位置标签映射和量化表作为输入,采用双域校正单位 (DCU) 作为基本组件,在 DRU 中引入了密集块以提高性能,并通过隐式双域转换能够处理彩色图像。DCN 相对于现有方法表现更为优越 - MM使用 DCT 插值滤波器在 FPGA 上实现精确高效的双曲正切激活函数
本文提出了一种基于离散余弦变换插值滤波器 (DCTIF) 的高精度近似方法,用于在 DNNs 中人工神经元的双曲正切激活函数的实现,相比以前的工作可以实现更高的精度。同时,我们论证了激活函数精度的提高可以对保持与精确函数相同的 DNN 训练 - 使用离散余弦变换进行 JPEG 图像压缩 - 调研
本文为针对使用离散余弦变换进行有损图像压缩的综述,旨在介绍用于全彩色静态图像应用的 JPEG 压缩算法及其各个组成部分。
- 基于联合 DCT、DWT 和 SVD 变换的图像认证数字水印
本文介绍了一种基于离散小波变换(DWT)、离散余弦变换(DCT)和奇异值分解(SVD)的混合数字图像水印技术,其中采用了 zigzag 算法。通过使用 DWT 的高频带来嵌入水印以添加更多信息、提高对某些攻击的鲁棒性,最后将 zigzag