- MM卷积神经网络图像分类的进展
本文介绍了卷积神经网络在图像分类任务中应用的不同架构,从 LeNet-5 到最新的 SENet 模型。同时比较了各个模型的性能差异和训练细节。
- ICLR使用欧几里得频谱变换在非均匀几何信号上应用卷积神经网络
本文提出了一种基于非均匀傅里叶变换(NUFT)的新方法,用于直接、最优地对定义在单纯形网格上的不同拓扑结构的非均匀数据信号进行采样,从而将信号转换到频谱域中,并利用卷积神经网络进行信号分析,从而实现 3D 形状检索和点云到曲面重建等任务。
- CVPRMBS:卷积神经网络模型压缩的宏块缩放技术
本文提出了一种宏块缩放算法 (MBS),可适用于各种 CNN 体系结构,以减小其模型大小。通过与 ImageNet 和 CIFAR-10 的经验研究表明,MBS 可以进一步减小某些已经紧凑的 CNN 模型的模型大小,同时即使是超深的 Res - ECCVCBAM:卷积块注意力模块
本文提出一种卷积块自适应模型 (Convolutional Block Attention Module, CBAM),通过自适应特征细粒度调整, CBAM 可以被轻松集成到任何卷积神经网络架构中,改进了分类和检测性能。
- CVPR视音频生物特征匹配
本文研究了跨模态匹配,通过使用静态图像的人脸识别和声纹识别作为训练和测试数据集,使用 CNN 架构进行了二进制和多元交叉模态人脸和音频匹配,并比较了动态和静态测试,得出了 CNN 在此任务上表现优秀并超越了人类表现。
- 基于引导特征反演的深度神经网络预测解释方法
本文提出了一种基于指导特征反演框架的深度神经网络解释模型,可以确定神经网络中每个特征的贡献并提供决策过程的洞见,通过与 DNN 模型输出层目标类别的神经元进一步交互,我们强制解释结果具有类别区别能力,实验证明了我们提出的框架在提供 DNN - NIPS基于图像合成的深度 3D 人体姿态估计
本文提出了一种在 “野外” 环境中进行三维人体姿态估计的解决方案,通过生成大量的具有三维姿势标注的逼真合成图像,并使用这些图像对全身三维姿势进行端对端的卷积神经网络训练,成功地在受控环境(Human3.6M)中优于大多数已发表的作品,并在真 - ICLR简单高效的卷积神经网络架构搜索
该研究提出了一种自动设计合适的卷积神经网络结构的方法,使用了能产生网络变形的 “山峰爬升法” 和余弦退火法,并取得了较为优异的结果。
- CVPR面向摄像机 (camera) 重定位的 CNN 地图表示和压缩
本文研究了使用卷基层神经网络进行相机定位的方法,并应用于地图压缩。在不牺牲重定位性能的前提下,我们使用较小的 CNN 体系结构,引入基于 CNN 的地图压缩的概念。我们在一系列公开可用的数据集上评估了这种方法,并通过增加训练轨迹的数量来提高 - ICCV抽象图像分类数据集上深度学习的评估
本文提出一种新型图像分类数据集,并评估了流行的卷积神经网络结构在此数据集上的分类表现,该数据集使用抽象类进行分类,具有人类易于解决但挑战 CNN 的特点。同时还发现了该数据集的变体可以为进一步研究提供有趣的可能性。
- ICCV通过网络削减学习高效卷积网络
本文提出了一种名为 “网络瘦身” 的新颖学习方案,可以通过引入通道级稀疏性,简化深度卷积神经网络,降低了其计算成本,减小了运行时内存占用,同时不影响准确度。我们进行了多组实验,证明了该方案在各种图像分类数据集上具有较好的效果。
- CVPR基于切换卷积神经网络的人群计数
本文提出了一种新型的人群计数模型,使用带有密度的人群场景提高预测准确性和定位精度的切换卷积神经网络,并通过对所有主要人群计数数据集的广泛实验验证了其比现有最先进的方法具有更好的表现。
- ICCV广义的无序汇聚执行隐式显著匹配
提出了一种泛化的 alpha-pooling 方法,可以在训练中学习汇编策略,同时引入一种有效的决策可视化方法来分析语义组成对决策的影响,实验证明这个方法可以在各种标准数据集上优于传统的的平均池化和双线性池化方法。
- 面向视觉地点识别的大规模深度学习特征
该研究通过训练两个卷积神经网络 (CNN) 架构来实现特定位置识别任务,并采用多尺度特征编码方法生成具备不变性的特征。通过建立具有变化外观的特定场所数据集 (SPED),该研究综合评估了所训练的网络,并证明相对于其他场所识别算法和预训练的 - ECCV一份 4D 光场数据集及用于材料识别的 CNN 架构
介绍了一个新的光场数据集,并利用深度学习在 4D 光场上进行材料识别。实验中,最佳表现的 CNN 架构相比 2D 图像分类提高了 7%(从 70%到 77%),这些结果构成了对 CNN 应用于光场应用的重要基线。
- NIPSMoCap 引导的数据增强在野外三维姿态估计中的应用
该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型,用于解决 3D 人体姿态估计缺少真实数据的问题,并通过在受控环境和实境的表现表明其可行性。
- 对 ImageNet 上 CNN 进步的系统评估
本文系统地研究了卷积神经网络结构和学习方法的多个进展对目标分类(ILSVRC)问题的影响,并测试了网络结构、学习参数和图像预处理等因素对分类结果的影响。结果表明,使用 128x128 像素图像即可得出优化网络结构的定性结论,这些结果比标准的 - 用拉普拉斯金字塔重建和细化进行语义分割
本文提出在卷积神经网络 (CNN) 中,通过 Laplacian 金字塔多分辨率重构和高分辨率特征地图的跳跃连接和乘法门来逐步优化从低分辨率地图中重构的区段边界,从而实现对需要密集像素标记的任务的高效语义分割。在 PASCAL VOC 和 - 近似概率模拟和深度神经网络相对评价作为人类物理场景理解的解释
本文从物理场景理解出发,比较了基于直觉物理引擎、基于记忆模型和基于卷积神经网络的场景理解模型,发现基于模拟的模型在人类思维和感知的角度上更胜一筹,并且拥有更好的泛化能力。
- ICML通过串联整流线性单元了解和改进卷积神经网络
本篇论文提出了一种新的、简单而有效的激活方法,称为 CRelu,并将其与现有的卷积神经网络模型相结合,从而大大提高了它们在 CIFAR-10/100 和 ImageNet 数据集上的性能。