深度网络在不变物体识别中类似于人类前馈视觉
本文通过严格的评估探索了不同的深度学习架构,比较它们在公共领域的性能,并识别和披露了重要的实现细节,同时指出了CNN基础表示的几个有用属性,包括输出层维度可以显著降低而不会对性能产生不利影响,以及深浅层方法可以成功共享的方面。
May, 2014
本研究研究了深度神经网络在计算机视觉领域上的发展,并提出了“欺骗图像”的概念,在模型认为是熟悉对象的情况下生成了一系列对人类难以识别的图像,揭示了计算机视觉与人类视觉之间的有趣差异。
Dec, 2014
在图像质量失真的影响下,深度神经网络的表现远不及人类,但两者的错误率存在着较少的相关性,表明图像的内部表现在网络和人类眼中存在差异。这些与人类视觉表现的比较有助于指导未来更具鲁棒性的深度神经网络的发展。
May, 2017
本文比较了人类视觉系统和深度神经网络(DNN)在图像退化方面的泛化能力,发现人类视觉系统更加耐受于图像处理,而当信号变弱时,人类和DNN的分类误差模式逐渐分离,这表明在视觉识别方面,人类和DNN之间仍存在显著差异。
Jun, 2017
通过对三种著名的深度卷积神经网络在十二种不同的图像失真下的实验对比,研究表明,与这三种人工智能算法相比,人类视觉系统在几乎所有的测试图像处理中都更加鲁棒,其误差模式渐行渐远。本文还证明了,利用失真图像直接训练的深度学习神经网络在恰当的测试条件下,表现优于人类。然而,当被分别用于测试不同类型的失真图像时,它们的泛化能力极差,无法适应噪声分布的变化,这成为深度学习视觉系统所面临的关键挑战,可用一种终身机器学习的方法进行系统化解决。
Aug, 2018
比较了卷积神经网络和注意力网络的性能差异,使用新的指标展示了注意力网络的错误更贴近于人类,这些结果对于构建更人类化的视觉模型以及理解视觉对象识别在人类中的意义具有意义。
May, 2021
研究发现,尽管深度神经网络(DNNs)的成功主要是由于计算规模,而不是基于生物智能的洞见,但是随着精度的提高,DNNs与人类视觉策略的一致性逐渐降低,但是神经谐振器的出现可以使DNNs与人类的视觉策略相一致并提高分类精度。
Nov, 2022
本文回顾了当前深度神经网络在作为人类核心物体识别合适的行为模型方面存在的证据,并指出深度神经网络作为计算模型的质量是一个多维概念,需要在建模目标方面达成明确的理解与共识。本文通过分析大量的人类感知和深度神经网络核心物体识别能力的心理物理和计算机探究,得出深度神经网络作为科学工具的价值性,同时认为深度神经网络目前只是作为人类核心物体识别行为的有前途但尚不充分的计算模型。在此过程中,我们驳斥了一些关于深度神经网络在视觉科学中存在的神话。
May, 2023
本文发现,尽管深度学习神经网络在图像识别任务上比人类表现更好,但它们不能很好地预测自然图像在颞下皮层(IT cortex)的神经响应,我们提出了神经协调器,通过该工具可以纠正这个问题。
Jun, 2023
深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中,我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现,与最先进的预训练网络(EfficientNet,SWAG,ViT,SWIN,BEiT,ConvNext)相比,人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是,当我们限制图像暴露时间时,人类的表现下降到深度网络的水平,这表明当人类在不寻常姿势下识别物体时,会进行额外的心理过程(需要额外的时间)。最后,我们对人类和网络的错误模式进行分析,发现即使是时间有限的人类与前馈深度网络也有不相似之处。我们得出结论,需要更多的工作来使计算机视觉系统具备人类视觉系统的鲁棒性。了解额外的观察时间中进行的心理过程的性质可能是获得这种鲁棒性的关键。
Feb, 2024