在立体派艺术中探测人物

Sep, 2014

Detecting People in Cubist Art

Shiry Ginosar, Daniel Haas, Timothy Brown, Jitendra Malik

TL;DR本文通过对毕加索的绘画作品中的抽象畸变物件的检测，比较了四种目标检测算法与人眼视觉感知的相似度，结果证明人类视觉感知能远胜目前算法，并且人类视觉感知和基于部件的模型表现了类似的性能下降，印证了大脑中基于部分的目标表征理论。

Abstract

Although the human visual system is surprisingly robust to extreme distortion when recognizing objects, most evaluations of computer object detection methods focus only on robustness to natural form deformations such as people's pose changes. To determine whether algorithms truly mirro

computer vision object detection human perception abstract art part-based models

发现论文，激发创造

人类和机器对极端图像变换下的物体识别的鲁棒性

该论文探讨了神经网络架构在解决视觉任务时存在的局限性，与人类学习抽象概念的策略不同。研究利用一组新的图像转换方法，对人类和网络在对象识别任务上进行了评估，发现常见网络的性能迅速下降，而人类能够以高精度识别对象。

May, 2022

使用卷积神经网络检测艺术作品中的人物

该研究表明 fine-tune 卷积神经网络在艺术品中进行物体检测的表现具有极高的性能，但仍需要进一步研究来解决跨图像类型检测的问题。

Oct, 2016

当信号变弱时，深度神经网络与人类的物体识别能力的比较

本文比较了人类视觉系统和深度神经网络（DNN）在图像退化方面的泛化能力，发现人类视觉系统更加耐受于图像处理，而当信号变弱时，人类和 DNN 的分类误差模式逐渐分离，这表明在视觉识别方面，人类和 DNN 之间仍存在显著差异。

Jun, 2017

跨越呈现问题：计算机视觉算法用于艺术作品和照片中物体的识别

本研究针对视觉识别中的交叉描绘问题进行了分类、领域适应和深度学习方法的基准测试，发现拥有强大的部件间空间关系模型的方法通常更强大，进而得出该模型在建模对象类别方面具有重要作用且不受外观细节影响的结论。

May, 2015

物体检测中的幻觉 —— 视觉部分验证研究

本研究发现，物体探测器可以出现幻象并检测丢失的物体，这对于依赖于视觉部分验证的应用程序特别有问题。我们通过提出第一个视觉部分验证数据集 DelftBikes，来研究如何解决这个问题，并且提出了依靠召回率来比较流行的物体探测器在 DelftBikes 数据集上的表现。共有 10,000 张自行车图片，每张图像有 22 个密集注释的部分，并明确标注每个部分的额外对象状态标签，反映部分是否缺失或完好。

Jun, 2021

在真实场景中检测卷积神经网络生成的人脸图像

研究表明，基于 CNN 的检测方法在现实场景中的鲁棒性还不足，本研究提出了一个跨模型、跨数据和后处理评估框架，并评估了最先进的检测方法，同时还探讨了常用的图像预处理方法及人类对于 CNN 生成图像的检测表现及影响因素。

May, 2020

人类素描对于物体检测有何作用？

本研究介绍一种基于草图的物体检测框架，利用基础模型（如 CLIP）和既有的草图模型（如 SBIR）之间的协作来构建高度可推广的草图和照片编码器，并设计一种训练范式来适应对于物体检测，评估结果显示该框架在零样本设置下的表现优于有监督的和弱监督的对象检测器。

Mar, 2023

使用神经网络捕捉视觉对象

本研究回顾了关于人类目标感知和深度神经网络模型在目标识别方面的相关工作，并探讨了这两个领域如何相互促进，提供了发展新实验任务和推动深度神经网络模型中的目标识别的基准的认知文献和实验任务。

Sep, 2021

人类在给予足够时间的情况下，以不常见的姿势识别物体时胜过深度神经网络

深度学习与人类在几个物体识别基准上的差距正在缩小。在本文中，我们研究了在不寻常视角下观察物体的情况下这个差距。我们发现，与最先进的预训练网络（EfficientNet，SWAG，ViT，SWIN，BEiT，ConvNext）相比，人类在识别不寻常姿势的物体方面表现得更出色。值得注意的是，当我们限制图像暴露时间时，人类的表现下降到深度网络的水平，这表明当人类在不寻常姿势下识别物体时，会进行额外的心理过程（需要额外的时间）。最后，我们对人类和网络的错误模式进行分析，发现即使是时间有限的人类与前馈深度网络也有不相似之处。我们得出结论，需要更多的工作来使计算机视觉系统具备人类视觉系统的鲁棒性。了解额外的观察时间中进行的心理过程的性质可能是获得这种鲁棒性的关键。

Feb, 2024

利用 CIFAR10 比较深度神经网络和人类的视觉识别性能

本文通过对自然图像数据集 CIFAR10 的人工识别实验，与最新的深度神经网络进行了公平的比较，揭示了当前人工智能目标识别与人类识别能力之间的差距，同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。

Nov, 2018