人类和深度学习在视觉扭曲下识别性能的研究与比较
通过对三种著名的深度卷积神经网络在十二种不同的图像失真下的实验对比,研究表明,与这三种人工智能算法相比,人类视觉系统在几乎所有的测试图像处理中都更加鲁棒,其误差模式渐行渐远。本文还证明了,利用失真图像直接训练的深度学习神经网络在恰当的测试条件下,表现优于人类。然而,当被分别用于测试不同类型的失真图像时,它们的泛化能力极差,无法适应噪声分布的变化,这成为深度学习视觉系统所面临的关键挑战,可用一种终身机器学习的方法进行系统化解决。
Aug, 2018
本文比较了人类视觉系统和深度神经网络(DNN)在图像退化方面的泛化能力,发现人类视觉系统更加耐受于图像处理,而当信号变弱时,人类和 DNN 的分类误差模式逐渐分离,这表明在视觉识别方面,人类和 DNN 之间仍存在显著差异。
Jun, 2017
本文研究并比较了人类视觉系统和最先进的深度神经网络在分类扭曲图像方面的表现,发现在模糊和嘈杂的图像条件下,仍然表现出人类视觉系统更加优越的性能,这些发现激励未来研究开发更加稳健的深度网络。
Oct, 2017
本研究研究了深度神经网络在计算机视觉领域上的发展,并提出了 “欺骗图像” 的概念,在模型认为是熟悉对象的情况下生成了一系列对人类难以识别的图像,揭示了计算机视觉与人类视觉之间的有趣差异。
Dec, 2014
本文系统研究图像失真对深度神经网络分类器的影响,提出了重训练与加噪音微调两种方法,结果表明在特定条件下,加噪音微调可以有效减轻图像失真对分类器的影响,并且比重新训练更为实用。
Jan, 2017
该论文探讨了神经网络架构在解决视觉任务时存在的局限性,与人类学习抽象概念的策略不同。研究利用一组新的图像转换方法,对人类和网络在对象识别任务上进行了评估,发现常见网络的性能迅速下降,而人类能够以高精度识别对象。
May, 2022
本文研究计算机视觉、深度神经网络(DNN)、人类视觉感知和无体系结构视觉学习之间的联系,并发现 DNN 计算可用于估计感知损失,并与有趣的理论观点一致,即人类感知的特性是视觉学习无体系结构的结果。
Jan, 2017
本文通过对自然图像数据集 CIFAR10 的人工识别实验,与最新的深度神经网络进行了公平的比较,揭示了当前人工智能目标识别与人类识别能力之间的差距,同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。
Nov, 2018
本文提出了一种称为 DeepCorrect 的方法,通过对权值进行微调,修正深度神经网络中感受野受损图像变形的问题,该方法显著提高了网络的鲁棒性和性能。
May, 2017
本文评估了四种最先进的深度神经网络模型在图像分类方面对模糊、噪声、对比度、JPEG 和 JPEG2000 压缩等五种图像质量扭曲的表现,结果表明现有网络对图像质量扭曲特别是模糊和噪声较为敏感,这为未来开发更具抗图像质量扭曲能力的深度神经网络开展了研究。
Apr, 2016