探索卷积融合网络在视觉识别中的应用

MMNov, 2016

探索卷积融合网络在视觉识别中的应用

On the Exploration of Convolutional Fusion Networks for Visual Recognition

Yu Liu, Yanming Guo, Michael S. Lew

TL;DR通过卷积融合网络 (CFN) 和适应性权重的学习，实现多尺度深度表示的高效融合，并在场景识别、细粒度识别和图像检索等任务中获得显著改进。

Abstract

Despite recent advances in multi-scale deep representations, their limitations are attributed to expensive parameters and weak fusion modules. Hence, we propose an efficient approach to fuse multi-scale deep representations, called →

multi-scale deep representations convolutional fusion networks adaptive weights fine-grained recognition image retrieval

发现论文，激发创造

融合深度卷积网络进行大规模视觉概念分类

本研究从大数据方面对卷积神经网络进行了分析，并在单个和多个网络模型上提出了有效的融合机制，为大数据从业人员提供了最佳实践，从而在保持计算成本较低的情况下，在基准数据集上取得了最先进的结果。

Aug, 2016

Big-Little Net：一种高效的多尺度特征表示方法，用于视觉和语音识别

该论文提出了一种新的卷积神经网络 (CNN) 架构，通过使用具有不同计算复杂度的多分支网络，在不同的尺度上频繁合并特征，以使用更少的计算实现多尺度特征，并在目标识别和语音识别任务上显著提高了模型效率和性能。

Jul, 2018

紧凑的双重融合网络用于边缘检测

本文提出了一种紧凑型次级融合网络 (Compact Twice Fusion Network, CTFN)，其中包括语义增强模块 (Semantic Enhancement Module, SEM) 和伪像素级加权模块 (Pseudo Pixel-level Weighting, PPW) 以完全整合多尺度特征，以及一种名为动态聚焦损失的新型损失函数，可用于处理纹理噪声干扰带来的分类挑战，在三个数据集上评估，CTFN 在参数和计算成本上均优于现有最先进方法。

Jul, 2023

深度卷积神经网络的视觉实例检索

本文研究使用卷积网络所提供的图像表示在视觉实例检索任务中的可用性，并通过利用多尺度图像特征提取方案，特别地，通过将几何不变性纳入到明确的位置、尺度和空间一致性中的方法来提取来自于该网络的局部特征，实验结果表明，如果对其进行适当提取，那么通用卷积网络图像表示法可优于其他先进方法。

Dec, 2014

深度卷积稀疏编码网络用于图像融合

这篇论文介绍了三种基于深度卷积稀疏编码网络的图像融合任务，并使用字典卷积单元将 CSC 模型和迭代收缩阈值算法泛化，从而从数据中学习所有超参数。广泛的实验和综合比较表明，与量化评估和视觉检查相关的所有性能指标中，所提出的网络优越性显著。

May, 2020

融合多路深度网络进行视频分类

本研究提出了一种多流深度网络架构，用于解决视频分类问题。通过训练三种卷积神经网络来建模视频中的空间、短期动态和音频线索，并采用长短期记忆网络来探索长期时间动态，最终通过自适应融合方法生成预测结果，将多模态信息充分利用。实验证明，该方法的性能明显优于现有的方法。

Sep, 2015

OverFeat: 使用卷积网络集成识别、定位和检测

本文提出了一个基于卷积网络进行分类、定位和检测的综合框架，展示了如何在 ConvNet 中高效实现多尺度和滑动窗口方法，并通过学习预测目标边界来实现定位，最后释放了我们最佳模型的特征提取器 OverFeat。

Dec, 2013

单图像超分辨率轻量级特征融合网络

该研究提出一种轻量级特征融合网络 (LFFN)，利用主轴块和 softmax 特征融合模块 (SFFM) 来实现全面探索多尺度上下文信息、极大地降低网络参数而最大化单幅图像超分辨率 (SISR) 结果。

Feb, 2019

大规模图像识别的极深卷积网络

本文通过使用小的卷积滤波器的架构，对不断增加深度的网络的精度进行了全面评估，表明通过将深度推到 16 至 19 个权重层，可以显著提高以往技术水平，并在 ImageNet Challenge 2014 中获得了第一和第二名。我们还证明了该表示法在其他数据集上具有很好的泛化性能，并公开了我们表现最佳的两个 ConvNet 模型，以便进一步研究深度视觉表示在计算机视觉中的应用。

Sep, 2014

重新思考 Inception 架构在计算机视觉中的应用

本篇论文主要研究了如何利用适当分解卷积和激进的正则化等方法，使卷积神经网络计算效率最大化，并以 ILSVRC2012 分类挑战作为基准，报告了使用少于 2500 万参数的 5 亿乘加运算成本的网络，评估单帧评估的 top-1 误差 21.2％和 top-5 误差 5.6％的显著成果。

Dec, 2015