- 在空间频域中评估对抗鲁棒性
CNN 模型易受到对抗攻击的脆弱性为安全关键应用的部署带来了担忧,本研究通过在频域中构建空间频率图层来探讨 CNN 模型的脆弱性,通过广泛的实验观察到空间频率 CNN 模型在白盒和黑盒攻击下比常规 CNN 模型更加稳健,此外,发现低频成分对 - UNIQA:面向完全参考和无参考图像质量评估的统一框架
设计了一个用于全参考和无参考图像质量评价的统一网络,通过语义影响建模来提高性能,并且在各种数据集上超越了相关的最先进方法。
- Wasserstein 畸变:统一忠实度和真实性
我们介绍了一种图像畸变度量,Wasserstein 畸变度量,同时在像素级别忠实度和真实性方面进行了概括。我们展示了在不同参数选择下,Wasserstein 畸变度量在数学上是纯粹的忠实度约束或纯粹的真实性约束。在 Wassertein 畸 - DREAM:从逆向人类视觉系统实现视觉解码
DREAM 是一种基于人类视觉系统的基础知识的 fMRI 到图像的重构方法,通过模拟人类感知视觉世界的分层和并行特性来构建逆向路径,利用专门的路径从 fMRI 数据中提取语义、颜色和深度线索。实验证明,该方法在外观、结构和语义的一致性方面优 - MMSDDNet: 基于风格引导的双层解缠网络用于阴影检测
通过设计了 Style-guided Dual-layer Disentanglement Network (SDDNet) 来解决当前阴影检测方法中背景颜色对结果的不利影响,并通过 Shadow Style Filter (SSF) 模块 - 通过立体注意力实现自上而下的立体图像质量评估
通过顶部到底部的视角来引导质量评估流程,本研究提出了一种基于立体注意力的立体图像质量评估方法,利用顶部到底部的视角来引导质量评估流程,从高级双眼信号到低级单眼信号进行逐步校准,借助通用的立体注意力块实现立体感知中的顶部到底部哲学,通过引入能 - 视觉可感知差异的多重失真类型首个综合性数据集
本文利用深度学习建立了一个综合考虑多种畸变类型的 JND 模型,并构建了拥有 25 种畸变类型的用于 JND 建模的细到粗的数据集,为此设计了一种基于 Image Quality Assessment (IQA) 的 JND 候选选择方案, - ECCV形状、质感和颜色在视觉识别中的贡献
本文研究了人类视觉系统(HVS)的三个重要特征(形状,纹理和颜色)对物体分类的贡献,构建了一个人形视觉引擎(HVE),分别从图像中计算形状,纹理和颜色特征,然后将特征向量连接以支持最终分类,并利用 HVE 总结和排序三个特性对目标识别的贡献 - MM探索视频感知表征在盲视频质量评估中的有效性
通过提取 HVS 的视频感知表示,并通过测量其在感知领域中的表示方式的直线程度和紧凑性来量化视频的自然度和内容连续性,我们提出了一种评估视频临时失真的 TPQI 指标,并证明它对任何数据集都有可申请性,即使在评估具有大的时间变化的视频时也有 - 一种用于干净标签后门攻击的时间色度触发器,用于对抗反欺骗重播检测
我们提出了一种针对深度学习模型的隐蔽干净标签视频后门攻击,旨在检测特定类别的欺诈攻击,包括视频重新广播攻击。该攻击不会影响正常情况下的欺诈检测,但在特定触发信号的存在下,会产生错误分类。
- 卷积神经网络和 Transformer 对混合图像的感知类似于人类
混合图像技术(hybrid images)与深度学习视觉模型在研究人类视觉系统的多尺度图像处理方面具有定性一致性且卷积神经网络(CNN)和 Transformer 在视觉皮层腹侧通路中的前向信息传递建模方面表现优异。
- 计算机视觉中的注意力机制:综述
本文综述了在计算机视觉中引入的各种注意力机制的方法,着重介绍了通道注意力、空间注意力、时间注意力和分支注意力等方面,并提出了未来注意力机制研究的方向。
- 基于加权模糊的 PSNR 评价方法在水印应用中的研究
本文提出了一种基于人眼视觉系统的加权模糊评价标准,对于水印应用场景的图像质量评估具有更高客观性和准确性,实验证明该标准显著优于传统 PSNR 标准。
- 野外视频品质评估
本文提出了一种基于深度神经网络,利用人类视觉系统的内容依赖和时间记忆效应来进行无参考视频质量评估的方法,并在三个公开数据库上进行实验证明该方法相较于五种最先进的方法有着 12.39%,15.71%,15.45%和 18.09%不等的总体性能 - 快与慢:基于记忆的移动视频物体检测
本文探讨了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。我们通过交替使用传统的特征提取器和极其轻量级的提取器展示了在存在时间记忆的情况下,进行准确检测所需的计算量是非常小的。此外,我们展示了记忆容纳了足够 - 需要使用复现来捕获人类视觉系统的表现动态
本研究采用时间分辨脑成像和深度学习的方法,探究人脑视觉处理的层次动态及信息流向,结果表明,回归深度神经网络模型比参数匹配前馈模型更能准确捕捉人脑视觉处理的多区域功能
- 使用 MaxPol 卷积滤波器对图像锐度进行视觉敏感度编码评估
本文提出了一种新颖的设计,使用人类视觉系统 (HVS) 响应来分解与图像锐度水平密切相关的有意义的特征,旨在解决现有无参考图片清晰度评估技术的高计算成本和缺乏可扩展性的问题,并在数字病理学领域创建了名为 'FocusPath' 的基准数据库 - CVPRPieAPP:通过成对偏好感知图像误差评估
通过新的基于深度学习的方法,我们可以预测人眼在得到图片时可能出现的感知误差,这种方法可以更好地模拟人类感知系统对失真图像的认知。
- 盲预测相似质量图用于图像质量评估
本文介绍了一种基于卷积神经网络和池化网络的盲图像质量评估模型,能够有效地模拟人类视觉系统的特性,并通过全参考图像质量评估方法获得的中间相似度图来预测从扭曲的图像中像素之间的质量。最终结果通过深池化网络回归为得分,该方法表现优于许多现有的盲图 - 欺骗计算机视觉和受时间限制的人的对抗样本
通过将计算机视觉模型的对抗性样本转移到具有未知参数和架构的其他模型,并匹配人类视觉系统的初始处理,我们发现在计算机视觉模型之间强烈转移的对抗性样本会影响人类观察者的分类。