- 人类灵感的拓扑表示在未知环境中的视觉目标识别
在未知和杂乱的室内环境中,视觉物体识别对于移动机器人是一个具有挑战性的问题。为了实现这一目标,我们扩展了以前的工作,提出了 TOPS2 描述符以及伴随的 THOR2 识别框架,受到对象统一的人类推理机制的启发。我们通过使用 Mapper 算 - 通过扩大规模,也许您可以实现与人类相同的视觉体验,达到人类水平的目标识别能力
如果同时扩大数据规模、模型大小和图像分辨率,通过自监督学习可以实现人类级的视觉目标识别能力,而且使用基于掩码自编码器的高效自监督学习算法,可以在低成本的学术预算下进行扩展实验。
- 高效学习新视觉概念
本文提出一种新的方法 —— 在最先进的识别模型中加入符号知识图谱,从而提高了模型的识别新物体的准确性。实验结果表明,与现有的少样本分类器相比,该方法的性能更好。
- CVPR深度神经网络在三维泛化中的特性探究
本文旨在研究和描述深度学习模型对于目标在不同旋转角度下的 2D 图像是否能够进行准确分类,探讨了三种通用的模型 (3D 通用、纯 2D 匹配和基于视角线性组合匹配) 在模型泛化性方面的表现,其中可以发现深度模型泛化能力强,但是其实现方式与这 - Sill-Net:借助独立照明表示进行特征增强
本文提出了一种名为 Sill-Net 的神经网络架构,用于在训练过程中将光照特征从图像中分离出来,然后在特征空间中增强训练样本,并在多个目标分类基准测试中超越了当前最先进的方法。
- CVPR使用光学相干技术实现非直视下的直接目标识别
利用散射在壁面上形成的斑点模式,结合深度神经网络,实现在非直视条件下对被遮挡的目标进行识别的一种新方法。
- 利用 CIFAR10 比较深度神经网络和人类的视觉识别性能
本文通过对自然图像数据集 CIFAR10 的人工识别实验,与最新的深度神经网络进行了公平的比较,揭示了当前人工智能目标识别与人类识别能力之间的差距,同时提出了一种可用于评估和改进未来神经网络的新型 CIFAR10 分级子集。
- 当信号变弱时,深度神经网络与人类的物体识别能力的比较
本文比较了人类视觉系统和深度神经网络(DNN)在图像退化方面的泛化能力,发现人类视觉系统更加耐受于图像处理,而当信号变弱时,人类和 DNN 的分类误差模式逐渐分离,这表明在视觉识别方面,人类和 DNN 之间仍存在显著差异。
- 卷积神经网络(CNN)在食品图像识别中的应用
通过构建一个 5822 张图片数据集并使用五层 CNN 网络结构,利用几何变换的数据扩充技术来提高训练图片的数量,利用支持向量机(SVM)和 Bag-of-features(BoF)来进行食品图片识别,最终达到超过 90% 的准确率,有效避 - ECCV无监督领域自适应的深度重建分类网络
本文提出一种基于深度学习的新型无监督领域自适应算法,旨在通过设计一个新模型 Deep Reconstruction-Classification Network(DRCN)来联合学习两个任务以获得共享编码表示,在跨领域对象识别任务上实现表现 - 空间角色标注的深度嵌入
本文介绍了视觉信息嵌入词语(VIEW)的概念,通过在深度神经模型中使用微软 COCO 数据集来预测视觉对象之间的空间关系,为多模态背景知识到空间角色标记(SpRL)算法的转移做出了贡献。VIEW 应用于空间角色标记中,提出了一种选择互补特征 - ICLR基础级别分类促进视觉对象识别
本文研究基于儿童视觉物体识别能力的发展轨迹和 Bar (2003) 的理论,提出一种深度卷积神经网络训练的优化策略,在基础级别物体分类的基础上训练亚目标级别分类,进而在小型数据集的迁移学习中取得了优秀的效果提升,证明本方法的可行性和有效性。
- 使用自助法训练带有噪声标签的深度神经网络
该研究提出了一种通用的方法来处理噪声和不完整标记,通过增强具有一致性概念的预测目标,实现相似感知的相同预测。在多个数据集上的实验表明,该方法可以显著提高模型的标签鲁棒性和识别准确率,同时对未标记面部图像也有较好的效果。
- ICLR深度稀疏编码的无监督特征学习
本文提出了一种名为 Deep Sparse Coding 的新的无监督特征学习框架,扩展了稀疏编码到多层体系结构,用于视觉对象识别任务,在不同层次的稀疏编码之间连接一种稀疏到密集的模块,结合卷积神经网络(CNN)可达到最先进的性能表现。
- 分层体系结构中不变表示的无监督学习
我们提出了一种基于无监督自动学习的方法,可以学习出具有小样本复杂度的好的表示方法,在视觉对象识别等领域可以得到应用。通过无监督学习期间存储的一组模板,可以对每个图像块计算一种不变而又唯一的(有区分性的)签名,从而从很少的有标记例子中学习图像 - 稀疏编码算法中的快速推理及其在物体识别中的应用
该论文提出了一种简单有效的自适应稀疏编码算法,其可以学习到一组可能过度完备的基函数,通过这些基的线性组合可以重构自然图像块。这种方法可以应用到视觉物体识别任务中,并且可以得到比精确稀疏编码算法更加准确的结果。