融合深度卷积网络进行大规模视觉概念分类
本篇论文主要研究了如何利用适当分解卷积和激进的正则化等方法,使卷积神经网络计算效率最大化,并以 ILSVRC2012 分类挑战作为基准,报告了使用少于 2500 万参数的 5 亿乘加运算成本的网络,评估单帧评估的 top-1 误差 21.2%和 top-5 误差 5.6%的显著成果。
Dec, 2015
本文提供了对现有技术的卷积神经网络分析和拓扑构建的全面概述,并描述和评估了一些层次分类器。此外,本文还开发了一种可视化分类错误的新方法,并在 CIFAR-100 上量化了一些结果,如在精度方面较小批量大小、平均集成、数据增强和测试时间转换等的积极影响。本文还开发了一个模型,它只有 100 万个学习参数,适用于 32x32x3 和 100 类输入,并在基准数据集 Asirra、GTSRB、HASYv2 和 STL-10 上击败了现有技术。
Jul, 2017
本文从深度卷积神经网络的内在分类入手,将现有研究成果归纳为七大类,即空间利用、深度、多路径、宽度、特征图利用、通道增强和注意力,同时介绍 CNN 组件的基础理解、当前挑战和应用领域。
Jan, 2019
本研究提出了一种多流深度网络架构,用于解决视频分类问题。通过训练三种卷积神经网络来建模视频中的空间、短期动态和音频线索,并采用长短期记忆网络来探索长期时间动态,最终通过自适应融合方法生成预测结果,将多模态信息充分利用。实验证明,该方法的性能明显优于现有的方法。
Sep, 2015
通过对卷积神经网络 CNNs 模型对文件图像分类任务的研究,我们发现使用剪切变形的数据扩增和一个针对更大输入图像设计的架构,可以超过基准数据集的现有技术,并且我们发现使用 RVL-CDIP 训练的 CNNs 可以学习区域特定的布局特征。
Aug, 2017
该研究论文探讨了计算机视觉问题中使用深度学习技术的发展趋势,着重介绍了卷积神经网络(CNNs)及其应用,帮助初学者了解何种深度网络适用于计算机视觉问题。
Jan, 2016
通过给训练数据增加更多的图像变换、给测试时产生更多的预测和使用应用于更高分辨率图像的补充模型等多种技术,我们改进了目前基于深度卷积神经网络的图像分类流程,并在 Imagenet 大规模视觉识别挑战赛 2013 中获得了前五名,我们的系统分类错误率为 13.55%,相对于上一年的获胜者,出现了超过 20%的相对提高。
Dec, 2013
介绍了一种新的可视化技术,通过消融研究得出了超越 Krizhevsky 等在 ImageNet 分类基准上的模型架构,其 ImageNet 模型表现优异并且泛化性良好,可以轻松地在其他数据集上取得优异的分类效果。
Nov, 2013