早期人类视觉系统能否与深度神经网络竞争？

ICCVOct, 2017

早期人类视觉系统能否与深度神经网络竞争？

Can the early human visual system compete with Deep Neural Networks?

Samuel Dodge, Lina Karam

TL;DR本文研究并比较了人类视觉系统和最先进的深度神经网络在分类扭曲图像方面的表现，发现在模糊和嘈杂的图像条件下，仍然表现出人类视觉系统更加优越的性能，这些发现激励未来研究开发更加稳健的深度网络。

Abstract

We study and compare the human visual system and state-of-the-art deep neural networks on classification of distorted images. Different from previous works, we limit the display time to 100ms to test only the early mech

human visual system deep neural networks image classification early mechanisms robust deep networks

发现论文，激发创造

人类和深度学习在视觉扭曲下识别性能的研究与比较

在图像质量失真的影响下，深度神经网络的表现远不及人类，但两者的错误率存在着较少的相关性，表明图像的内部表现在网络和人类眼中存在差异。这些与人类视觉表现的比较有助于指导未来更具鲁棒性的深度神经网络的发展。

May, 2017

当信号变弱时，深度神经网络与人类的物体识别能力的比较

本文比较了人类视觉系统和深度神经网络（DNN）在图像退化方面的泛化能力，发现人类视觉系统更加耐受于图像处理，而当信号变弱时，人类和 DNN 的分类误差模式逐渐分离，这表明在视觉识别方面，人类和 DNN 之间仍存在显著差异。

Jun, 2017

人类与深度神经网络的泛化能力

通过对三种著名的深度卷积神经网络在十二种不同的图像失真下的实验对比，研究表明，与这三种人工智能算法相比，人类视觉系统在几乎所有的测试图像处理中都更加鲁棒，其误差模式渐行渐远。本文还证明了，利用失真图像直接训练的深度学习神经网络在恰当的测试条件下，表现优于人类。然而，当被分别用于测试不同类型的失真图像时，它们的泛化能力极差，无法适应噪声分布的变化，这成为深度学习视觉系统所面临的关键挑战，可用一种终身机器学习的方法进行系统化解决。

Aug, 2018

利用 CIFAR10 比较深度神经网络和人类的视觉识别性能

本文通过对自然图像数据集 CIFAR10 的人工识别实验，与最新的深度神经网络进行了公平的比较，揭示了当前人工智能目标识别与人类识别能力之间的差距，同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。

Nov, 2018

人类在给予足够时间的情况下，以不常见的姿势识别物体时胜过深度神经网络

深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中，我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现，与最先进的预训练网络（EfficientNet，SWAG，ViT，SWIN，BEiT，ConvNext）相比，人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是，当我们限制图像暴露时间时，人类的表现下降到深度网络的水平，这表明当人类在不寻常姿势下识别物体时，会进行额外的心理过程（需要额外的时间）。最后，我们对人类和网络的错误模式进行分析，发现即使是时间有限的人类与前馈深度网络也有不相似之处。我们得出结论，需要更多的工作来使计算机视觉系统具备人类视觉系统的鲁棒性。了解额外的观察时间中进行的心理过程的性质可能是获得这种鲁棒性的关键。

Feb, 2024

人类和机器对极端图像变换下的物体识别的鲁棒性

该论文探讨了神经网络架构在解决视觉任务时存在的局限性，与人类学习抽象概念的策略不同。研究利用一组新的图像转换方法，对人类和网络在对象识别任务上进行了评估，发现常见网络的性能迅速下降，而人类能够以高精度识别对象。

May, 2022

计算机视觉中的人类感知

本文研究计算机视觉、深度神经网络（DNN）、人类视觉感知和无体系结构视觉学习之间的联系，并发现 DNN 计算可用于估计感知损失，并与有趣的理论观点一致，即人类感知的特性是视觉学习无体系结构的结果。

Jan, 2017

多列深度神经网络用于图像分类

介绍了一种基于神经网络算法的计算机视觉和机器学习新方法，通过极小的感受野感知神经元构建深度神经网络来实现图像分类，相比于传统的方法显著提高识别性能

Feb, 2012

深度网络在不变物体识别中类似于人类前馈视觉

研究了深度卷积神经网络在视角变化下物体识别任务中的表现，发现在视角变化较小时，浅层网络可以优于深层网络和人类表现。但是，当面临较大的视角变化时，需要更深的层次来匹配人类表现。最深的 18 层卷积神经网络在最高变化水平下优于人类表现，使用了最类人的表征。

Aug, 2015

利用人类腹侧视觉通路提高神经网络的稳健性

DNNs guided by neural representations from the human ventral visual stream display increasing robustness to adversarial attacks, develop more human-like decision-making patterns, and suggest new robustness solutions by emulating the human brain.

May, 2024