- 基于改良的 SE-InceptionV3 的猴痘病识别模型
利用改进的 SE-InceptionV3 模型,本研究通过在 InceptionV3 框架中嵌入 SENet 模块和 L2 正则化的方式提高了猴痘病的检测准确性,通过对 Kaggle 猴痘数据集的测试,模型在测试集上表现出 96.71% 的 - CR-SFP:学习一致表示用于软滤波器裁剪
CR-SFP 是一种简单而有效的训练框架,通过学习一致的表示来改善软过滤器修剪后的模型准确性,同时减少网络的计算复杂度,适用于各种 CNN 架构。
- 利用卷积神经网络和集成学习进行自动化灾害图像分类
构建和训练多个卷积神经网络 (CNN) 架构,利用堆叠 CNN 集成方法对地震、洪水、野火和火山等自然灾害图像进行分类,实现了 95% 的准确率和 F1 得分达到 0.96,并通过调节超参数优化单个模型的性能,同时通过将 CNN 和 Res - ICCVGHN-QAT:训练图超网络以预测在未见过的有限精度神经网络中抗量化参数
通过研究我们发现,量化感知训练可以显著提高 4 位量化 CNN 的 GHN 预测参数的精确性,甚至可以让 2 位量化 CNN 的 GHN 预测参数的精确性超过随机结果。这些有希望的结果为未来的研究开辟了新的方向。
- 车辆灯光的鲁棒检测、关联和定位:基于环境的级联卷积神经网络方法和评估
通过上游车辆检测和可见光中心的近似值,本文提出了一种检测车辆灯光的方法,预测与每个车辆灯光相关的四个近似角点,可应用于自动驾驶中检测车辆灯光的网络。
- 噪声抑制卷积神经网络的信号处理解释
这篇文章通过将信号处理的基本原理与深度学习领域相连接,在统一的理论框架下,建立了对深度卷积框图的直观理解,解释了多样的编码 - 解码卷积神经网络架构,并提供了设计稳健高效的新颖卷积神经网络架构的重要指导。
- 熵变换网络:通过切向丛数据流形的学习方法
提出了一种用于图像转换的准确快速插值方法,通过在数据流形分布上进行插值和渐近线估计来计算变换器参数,以提高计算机视觉任务的预测准确性和同时降低计算成本。
- 对对抗传递性的可靠评估
本文重新评估了 12 种常见的对抗样本转移攻击方法,得出结论:对抗转移性经常被高估,在不同的流行模型之间不存在能够传递的单个对抗样本,并提出了一个可靠的基准,包括三个评估协议,以便未来的研究。
- 深度集成用于感知图像质量评估
提出了一种基于深度学习的方法,包含两个 CNN 子单元的深度架构,以及一个自行收集的包含自然扭曲的图像的图像库 BIQ2021,用于模型训练和验证。通过在多个数据集上的实验,证明了该方法的性能和广泛的泛化性能。
- 基于长度约束的卷积神经网络架构设计演化
通过限制模型长度等策略,利用搜索长度策略和基因算法进行搜索架构,从而在计算资源消耗极低的情况下取得 Cifar-10 数据集上 5.12% 的错误率。
- 利用单目视频对眼表面进行映射及其在干眼症评分中的应用
本篇研究通过运用三维摄像来追踪眼表面,并利用 CNN 架构估算眼球运动,解决了眼表面分析在光源移动和透明眼组织等问题上的难点,从而提高了对干眼症的有效诊断。
- 重新审视面部关键点检测:使用深度神经网络的高效方法
本研究旨在评估迁移学习模型,包括 MobileNetV2 和 NasNetMobile,以及自定义 CNN 体系结构,在模型大小、参数和推理时间方面开发高效的深度学习模型,并研究数据增强和微调对这些模型的影响。MobileNetV2 体系结 - 自监督单目深度估计中的 Transformer 模型(不考虑相机内参)
研究在自动驾驶和高级驾驶辅助系统下,使用视觉转换器作为新的方法来进行单目深度估计,在 KITTI 深度预测基准上取得了与卷积神经网络相似的性能,同时具有更强的鲁棒性和可扩展性。
- CVPR三流网络用于增强动作识别
该论文提出了两种基于 CNN 的体系结构,包括三种流,可以分别捕捉不同速率的空间和时间信息,并使用双向 LSTM 和注意力机制进一步提高模型性能,实现了人类动作识别任务的最先进表现。
- ECCV卷积神经网络压缩的稳定低秩张量分解
本研究是对卷积核张量分解退化性的第一项研究。我们提出了一种新方法,可以稳定卷积核的低秩近似,同时保证神经网络的高性能。在流行的 CNN 体系结构上评估我们的方法并显示它提供一致性的性能。
- CVPR自适应分数扩张卷积网络用于图像美学评估
本文提出了一种自适应分数膨胀卷积(AFDC)方法,采用图像宽高比嵌入、保持组成以及无需额外参数的方式在卷积内核层面处理图像宽高比信息,通过使用最近两个整数膨胀卷积核内插可以解决分数采样对齐问题;并提供了迷你批量训练的简洁公式,并利用分组策略 - 2018 机器人场景分割竞赛
通过 EndoVis 工作坊提出的机器人仪器分割数据集,在模拟真实手术时应用于学习适用的技术,其中包括了最先进的 U-Net 和其他流行的 CNN 架构,并且逐步增加这个数据集的复杂性,包括针对器械,类型和解剖器官的分割。
- UniPose:单张图片和视频中的统一人体姿态估计
提出了 UniPose,一种基于瀑布卷积模块的人体姿势估计统一框架,该模块结合了上下文分割和联合定位,实现了单阶段高精度的人体姿态估计,特别是在视频中取得了最先进的结果。
- AssembleNet: 在视频网络中搜索多流神经连接
本文提出一种名为 AssembleNet 的方法,通过进化算法自动发现连接更好、时空交互更强的神经网络结构,以达到更好的视频理解效果。该方法在公共视频数据集上优于以往的方法,尤其是在 Charades 数据集上,58.6% 的 mAP 表现 - ICML使用选择性通道分配训练卷积神经网络
本文提出了一种简单的方法,通过通道选择性来提高拥有大规模特征的 CNN 模型的能力,以更有效的资源利用实现更好的泛化性能。