早期人类视觉系统能否与深度神经网络竞争?
在图像质量失真的影响下,深度神经网络的表现远不及人类,但两者的错误率存在着较少的相关性,表明图像的内部表现在网络和人类眼中存在差异。这些与人类视觉表现的比较有助于指导未来更具鲁棒性的深度神经网络的发展。
May, 2017
本文比较了人类视觉系统和深度神经网络(DNN)在图像退化方面的泛化能力,发现人类视觉系统更加耐受于图像处理,而当信号变弱时,人类和 DNN 的分类误差模式逐渐分离,这表明在视觉识别方面,人类和 DNN 之间仍存在显著差异。
Jun, 2017
通过对三种著名的深度卷积神经网络在十二种不同的图像失真下的实验对比,研究表明,与这三种人工智能算法相比,人类视觉系统在几乎所有的测试图像处理中都更加鲁棒,其误差模式渐行渐远。本文还证明了,利用失真图像直接训练的深度学习神经网络在恰当的测试条件下,表现优于人类。然而,当被分别用于测试不同类型的失真图像时,它们的泛化能力极差,无法适应噪声分布的变化,这成为深度学习视觉系统所面临的关键挑战,可用一种终身机器学习的方法进行系统化解决。
Aug, 2018
本文通过对自然图像数据集 CIFAR10 的人工识别实验,与最新的深度神经网络进行了公平的比较,揭示了当前人工智能目标识别与人类识别能力之间的差距,同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。
Nov, 2018
深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中,我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现,与最先进的预训练网络(EfficientNet,SWAG,ViT,SWIN,BEiT,ConvNext)相比,人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是,当我们限制图像暴露时间时,人类的表现下降到深度网络的水平,这表明当人类在不寻常姿势下识别物体时,会进行额外的心理过程(需要额外的时间)。最后,我们对人类和网络的错误模式进行分析,发现即使是时间有限的人类与前馈深度网络也有不相似之处。我们得出结论,需要更多的工作来使计算机视觉系统具备人类视觉系统的鲁棒性。了解额外的观察时间中进行的心理过程的性质可能是获得这种鲁棒性的关键。
Feb, 2024
该论文探讨了神经网络架构在解决视觉任务时存在的局限性,与人类学习抽象概念的策略不同。研究利用一组新的图像转换方法,对人类和网络在对象识别任务上进行了评估,发现常见网络的性能迅速下降,而人类能够以高精度识别对象。
May, 2022
本文研究计算机视觉、深度神经网络(DNN)、人类视觉感知和无体系结构视觉学习之间的联系,并发现 DNN 计算可用于估计感知损失,并与有趣的理论观点一致,即人类感知的特性是视觉学习无体系结构的结果。
Jan, 2017
研究了深度卷积神经网络在视角变化下物体识别任务中的表现,发现在视角变化较小时,浅层网络可以优于深层网络和人类表现。但是,当面临较大的视角变化时,需要更深的层次来匹配人类表现。最深的 18 层卷积神经网络在最高变化水平下优于人类表现,使用了最类人的表征。
Aug, 2015
DNNs guided by neural representations from the human ventral visual stream display increasing robustness to adversarial attacks, develop more human-like decision-making patterns, and suggest new robustness solutions by emulating the human brain.
May, 2024