- CVPRImageNet 模型中的偏见能解释泛化吗?
基于大规模研究,通过对 48 个由不同训练方法得到的 ImageNet 模型进行测试,我们发现传统认为的偏见,包括形状偏见、频谱偏见和临界频带,无法准确预测模型整体的泛化能力。
- 语义分割的特征早期融合
通过将分类器网络与逆向 HRNet 架构集成,本文介绍了一种新颖的分割框架,用于高效的图像分割。我们的方法利用半监督预训练的 ResNet-50 骨干网络,在不同尺度上生成特征图,然后通过适应具有不同通道维度的逆向 HRNet 进行处理,产 - 分阶段深度相关和特征融合用于孪生物体追踪
我们提出了一种名为 DCFFNet 的新型分阶段深度相关性和特征融合网络,用于进一步优化可视化跟踪的特征提取。我们基于孪生网络架构构建了我们的深度跟踪器,该网络从头开始离线训练,利用多个大规模数据集进行端到端训练。我们将改进的 ResNet - 人类标注误差对卫星图像场景分类 ConvNets 的影响
该研究通过探究人员标注错误对卷积神经网络在高分辨率卫星图像场景分类上的影响,证明人员标注错误主要来自于类别依赖性错误,而非实例依赖性错误,这种影响类似于几种模拟标注噪音之一,即类别相关性噪音,而非像独立标注错误一样的统一噪音。
- 大规模块级自监督学习
该论文中,我们使用最新的自监督学习技术,探索了全面反向传播的替代方法,即以块为单位的学习规则。我们证明了一个块状预训练程序,由 ResNet-50 的 4 个主要层块独立训练并使用 Barlow Twins' loss 函数,在 Image - MM面向高性能的单阶段人体姿态估计
本文针对使用 Mask RCNN 进行人体姿态估计时存在的性能问题及效率问题,提出了一种基于改进后的全局上下文模块和 ResNet-50 骨架的人体姿态估计方法,取得了较好的姿态估计效果和运行效率。
- 通过面部对齐、训练优化和调度提高从面部视频中估计抑郁症的准确性
本文提出通过改进图像预处理和训练步骤,使用人脸对准等技术和更好的数据增强、优化和调度技术,基于 ResNet-50 的两个简单模型在单一流程和两个不同流程的分数级融合中取得了良好的结果,这表明预处理和训练过程中的特定修改会对模型性能产生显著 - 减少、重用、回收:通过蒸馏提高训练效率
本文研究了如何利用蒸馏来提高深度学习模型的训练效率,实验发现,蒸馏在 ResNet-50 和 BERT 模型上可以提高训练速度,尤其是在 BERT 模型初期进行蒸馏可以取得最佳效果。此外,通过对蒸馏方法的一些优化可以进一步提高蒸馏的效率。
- ICML回归基础:重新审视离分布检测基线
研究了使用已经训练好的神经网络分类器进行图像识别的方法,提出了一种基于分析神经网络映射空间的简单有效的方法对不在分布范围内的图像进行检测识别,成功提高了识别的准确率。
- TinaFace: 人脸检测的强大而简单的基线
该研究使用现有的模块和通用物体检测模型构建 TinaFace,实现人脸检测。TinaFace 在 WIDER FACE 挑战赛上实现了 92.1% 的精度。使用测试时增强后,TinaFace 的结果超过了当前最先进的方法,达到 92.4% - MEAL V2:在不使用技巧的情况下将基础 ResNet-50 提升至 80% 以上的 ImageNet Top-1 准确率
通过采用新的基于相似性损失和鉴别器的去除硬标记的蒸馏框架,该方法可以使基本的 ResNet-50 在 ImageNet 数据集上达到 80% 以上的 Top-1 准确率,为知识蒸馏奠定了强有力的基础,也是第一篇实现在不使用已有技巧的前提下提 - MeTRAbs: 度量尺度截断鲁棒热力图用于绝对三维人体姿态估计
该研究提出了一种新型的体积热图来实现更准确的人体姿势估计,并结合 2D 图像空间下的热图来实现绝对 3D 姿势的估计。该方法利用 ResNet-50 模型,在几项基准测试中取得了最新的最高成绩。
- GradAug: 深度神经网络的一种新正则化方法
提出了一种新的正则化方法(GradAug),该方法通过对神经网络进行宽度采样并使用随机变换的样本来对子网络进行正则化,从而引入自我引导的干扰,并具有很好的泛化性能,在图像分类、目标检测和实例分割方面表现出最佳结果。
- 基于混合金字塔图网络的车辆再识别中的空间重要性探索
该论文提出了一种基于空间图注意力的新型车辆重新识别方法,它能够精确探索特征图的空间重要性,进而达到明显的性能提升。高效的网络设计可以使其适用于各种规模的特征图,并且在三个大规模数据库方面优于现有的车辆重新识别方法。
- CVPR全景分割的训练和推理统一化
我们提出了一种端到端的网络,用于连接全景分割的训练和推理管道,通过使用密集实例亲和力来捕获像素对属于相同实例的概率,并与 ResNet-50 骨干网络配合使用,实现了对 Cityscapes 和 COCO 数据集的新记录。
- Campfire: 压缩、无正则、高度结构化的稀疏训练,用于硬件加速器
本文研究了使用逐步剪枝技术进行 CNN 的结构化稀疏训练,通过简化强制稀疏的结构,探索在卷积核和过滤器内进行细粒度剪枝的训练方法,实现了对全图像网的 ResNet-50 和 ResNet-50 v1.5 的少量损失精度的稀疏版本。同时还考虑 - ICCVA2J:基于锚点到关节回归网络的从单个深度图像估算三维关节姿势
提出了一种名为 A2J 的锚点到关节回归网络,使用 ResNet-50 作为主干网络进行全局 - 局部的空间上下文信息捕捉,以预测手和身体的 3D 关节位置,并且在多个实验数据集上得出其优越性和高速性。
- 稀疏神经网络训练的难点
本文研究了训练稀疏神经网络的困难,并对稀疏区间内的优化动态和能量景观进行了新的观察。研究发现,尽管优化器的失败,但存在一条线性路径从初始化到 “好” 的解,并从 “稀疏” 到 “稠密” 的子空间中寻找这条路径,可以帮助稀疏神经网络避开常见的 - 自拍:自监督图像嵌入预训练
本文介绍了一种名为 Selfie 的预训练技术,其可以通过对图像进行掩蔽语言建模来进行图像嵌入,并且可以很好地适用于低数据情况下的 ResNet-50 图像分类器的训练。
- 图像分类的十亿级半监督学习
通过利用大量未标记的图像,本文提出了一种基于师生范式的管道来改善卷积神经网络的性能,并对我们的方法取得成功的因素提供了广泛的分析,从而为图像分类的半监督学习产生高精度模型提出了建议。