在立体派艺术中探测人物
该论文探讨了神经网络架构在解决视觉任务时存在的局限性,与人类学习抽象概念的策略不同。研究利用一组新的图像转换方法,对人类和网络在对象识别任务上进行了评估,发现常见网络的性能迅速下降,而人类能够以高精度识别对象。
May, 2022
本文比较了人类视觉系统和深度神经网络(DNN)在图像退化方面的泛化能力,发现人类视觉系统更加耐受于图像处理,而当信号变弱时,人类和 DNN 的分类误差模式逐渐分离,这表明在视觉识别方面,人类和 DNN 之间仍存在显著差异。
Jun, 2017
本研究针对视觉识别中的交叉描绘问题进行了分类、领域适应和深度学习方法的基准测试,发现拥有强大的部件间空间关系模型的方法通常更强大,进而得出该模型在建模对象类别方面具有重要作用且不受外观细节影响的结论。
May, 2015
本研究发现,物体探测器可以出现幻象并检测丢失的物体,这对于依赖于视觉部分验证的应用程序特别有问题。我们通过提出第一个视觉部分验证数据集 DelftBikes,来研究如何解决这个问题,并且提出了依靠召回率来比较流行的物体探测器在 DelftBikes 数据集上的表现。共有 10,000 张自行车图片,每张图像有 22 个密集注释的部分,并明确标注每个部分的额外对象状态标签,反映部分是否缺失或完好。
Jun, 2021
研究表明,基于 CNN 的检测方法在现实场景中的鲁棒性还不足,本研究提出了一个跨模型、跨数据和后处理评估框架,并评估了最先进的检测方法,同时还探讨了常用的图像预处理方法及人类对于 CNN 生成图像的检测表现及影响因素。
May, 2020
本研究介绍一种基于草图的物体检测框架,利用基础模型(如 CLIP)和既有的草图模型(如 SBIR)之间的协作来构建高度可推广的草图和照片编码器,并设计一种训练范式来适应对于物体检测,评估结果显示该框架在零样本设置下的表现优于有监督的和弱监督的对象检测器。
Mar, 2023
本研究回顾了关于人类目标感知和深度神经网络模型在目标识别方面的相关工作,并探讨了这两个领域如何相互促进,提供了发展新实验任务和推动深度神经网络模型中的目标识别的基准的认知文献和实验任务。
Sep, 2021
深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中,我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现,与最先进的预训练网络(EfficientNet,SWAG,ViT,SWIN,BEiT,ConvNext)相比,人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是,当我们限制图像暴露时间时,人类的表现下降到深度网络的水平,这表明当人类在不寻常姿势下识别物体时,会进行额外的心理过程(需要额外的时间)。最后,我们对人类和网络的错误模式进行分析,发现即使是时间有限的人类与前馈深度网络也有不相似之处。我们得出结论,需要更多的工作来使计算机视觉系统具备人类视觉系统的鲁棒性。了解额外的观察时间中进行的心理过程的性质可能是获得这种鲁棒性的关键。
Feb, 2024
本文通过对自然图像数据集 CIFAR10 的人工识别实验,与最新的深度神经网络进行了公平的比较,揭示了当前人工智能目标识别与人类识别能力之间的差距,同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。
Nov, 2018