MixConv: 混合深度可分离卷积核
提出一种名为 MUXConv 的新型卷积神经网络层,旨在提高网络中空间和通道信息的流动以提高精度,与此同时保持计算效率;通过将其集成于一个高效的多目标进化算法中搜索最优模型超参数来证明 MUXConv 的有效性。在 ImageNet 上,MUXNet 几乎与 MobileNetV3 相当,但更加紧凑,且在人物检测和转移学习等情况下表现良好。
Mar, 2020
本文研究了如何提高卷积神经网络的效率,提出了一种基于动态卷积方法的新型卷积操作,在多种 CNN 结构上进行了测试,并表明该方法可以在减少计算开销的同时保持性能,从而达到了更高的效率。
Apr, 2020
本文介绍了 MobileNets 这一基于深度可分离卷积的轻量级深度神经网络架构,提出了利用全局超参数在时延和准确性之间平衡的方法,并在图像分类等多个领域进行了广泛实验。
Apr, 2017
提出一种名为 Dynamic Convolution 的新设计,基于卷积核的注意力动态地聚合多个并行卷积核,从而增加模型复杂度,提高卷积神经网络的表示能力,有效提高 MobileNetV3-Small 模型在 ImageNet 分类任务上的精度。
Dec, 2019
针对面部验证应用所需要效率极高和吞吐量大的需求,本文提出了基于混合深度卷积核的一组极其高效的深度学习模型 MixFaceNets,在多个数据集中对模型进行了评估,结果表明在计算复杂度相同的情况下,MixFaceNets 在所有的数据集上性能优于 MobileFaceNets,同时在计算复杂性在 500M 和 1G FLOPs 之间时,我们 MixFaceNets 的结果与排名前几位的模型相当,同时使用的 FLOPs 更少,验证了我们提出的 MixFaceNets 的实用价值。
Jul, 2021
提出了一种类似于 Inception 的新型卷积操作 Inception depthwise convolution,将大核卷积分解为四个通道维度上的平方小核、两个正交带状核和一个恒等映射,用于构建高吞吐量且性能表现强劲的网络 InceptionNeXt,取得了与性能相当的同时大幅提升训练效率,并可作为减少碳足迹的未来架构设计基线。
Mar, 2023
WaveMix 是一种用于计算机视觉的新型神经体系结构,它具有资源效率,可推广性和可扩展性,使用多级二维离散小波变换(2D-DWT)在 WaveMix 块中,可以比现有技术更快、更好地实现分割和分类。
May, 2022
本文介绍了一种使用稀疏性来代替密集操作的高效神经网络建模方法,通过实现一系列高效的稀疏基本操作,并将其用于 MobileNet v1,MobileNet v2 和 EfficientNet 等体系结构中进行了测试,表明稀疏模型不仅效率更高,而且精度比基准模型更高。
Nov, 2019
该论文提出了一种称为网络解耦(ND)的训练方法,可以将已有的卷积神经网络模型转换到 MobileNet 等深度可分离卷积结构中,进而加速 CNN,减少严重的准确度下降。通过实验,作者证明了 ND 与其他训练 - free 方法正交,可以更大程度的加速 CNN。
Aug, 2018
通过使用异构卷积内核,我们提出了一种新颖的深度学习架构,在减少计算量和参数数量的同时保持代表性效率,实现了在 VGG 和 ResNet 等 CNN 架构中 3 到 8 倍 FLOPs 的速度提升,并与组 / 深度卷积进行比较,证明其具有更高的准确性和更多的 FLOPs 减少。
Mar, 2019