深度神经网络计算图像连通组件的能力
本论文利用 MNIST 数据集通过训练 counting convolutional neural network 来探究卷积神经网络中数字特征的表示学习,实现对于行人计数场景的初步探索。
May, 2015
本文对深度神经网络在计算机视觉领域中的重要应用指标进行全面分析,发现能耗与批次大小和架构无关,准确度和推断时间在双曲线关系中,能源约束是最大可实现准确度和模型复杂度的上限,操作次数是推断时间的可靠估计。
May, 2016
本文提出了一种名为GU-Net的新型物体计数模型,采用卷积-反卷积网络进行特征提取和像素级物体密度估计,并使用可学习的 shortcut 建立门控连接以优化模型性能,在三个常用基准数据集上实现了当前领先的物体计数表现。
May, 2018
本文探讨了全连接前馈神经网络中隐藏节点的激活模式,提出了从两个信息处理系统,即连续性和离散性的角度来看待这种网络分类能力的新方式,并且重点突出了这两者搭配的重要性,为深度学习中神经网络的泛化能力提供了新的思路。
Jan, 2020
本文提出使用高斯卷积核来代替原来的卷积滤波器,以估计密度地图中的空间位置,以达到激励密度地图生成过程并克服注释噪声的目的。我们的研究为后续研究指明了新的方向,应该研究如何适当放松过分严格的基于像素级空间不变性的对象计数。我们在MCNN,CSRNet,SANet和ResNet-50等4个主流对象计数网络上进行了评估,对3个应用程序(即人群,车辆和植物计数)的7个流行基准进行了广泛的实验,并且实验结果表明我们的方法明显优于其他最先进的方法,实现了有关对象空间位置的有希望的学习。
Jun, 2022
研究发现,尽管深度神经网络(DNNs)的成功主要是由于计算规模,而不是基于生物智能的洞见,但是随着精度的提高,DNNs与人类视觉策略的一致性逐渐降低,但是神经谐振器的出现可以使DNNs与人类的视觉策略相一致并提高分类精度。
Nov, 2022
本文回顾了当前深度神经网络在作为人类核心物体识别合适的行为模型方面存在的证据,并指出深度神经网络作为计算模型的质量是一个多维概念,需要在建模目标方面达成明确的理解与共识。本文通过分析大量的人类感知和深度神经网络核心物体识别能力的心理物理和计算机探究,得出深度神经网络作为科学工具的价值性,同时认为深度神经网络目前只是作为人类核心物体识别行为的有前途但尚不充分的计算模型。在此过程中,我们驳斥了一些关于深度神经网络在视觉科学中存在的神话。
May, 2023
本文发现,尽管深度学习神经网络在图像识别任务上比人类表现更好,但它们不能很好地预测自然图像在颞下皮层(IT cortex)的神经响应,我们提出了神经协调器,通过该工具可以纠正这个问题。
Jun, 2023
本文解决了计算机视觉中类别无关计数的评估问题,指出现有基准在评估模型理解计数对象方面的不足。提出的Prompt-Aware Counting(PrACo)基准通过两项针对性测试和评价指标,显著提高了评估的准确性,发现一些最先进的方法在标准计数指标上表现出色,但在理解输入提示时存在明显缺陷。
Sep, 2024