本文探讨了图像分类模型训练过程中的一些改进方法,如数据增强和优化方法的变化,通过实验证明这些改进方法的整合能够显著提高 CNN 模型的准确性,在 ImageNet 上,我们将 ResNet-50 的 top-1 验证准确率从 75.3% 提高到 79.29%,而且还证明了这种提高对于其他应用领域,如目标检测和语义分割,也具有更好的迁移学习性能。
Dec, 2018
本论文提出了一种名为 TTFNet 的训练时间友好型网络,可在保持具有状态 - of-the-art 性能的情况下,将训练时间缩短七倍以上,并且可以快速进行目标检测,方法是使用高斯核对训练样本进行编码,以实现在训练时间,推理速度和准确性之间的平衡。
Sep, 2019
本文研究物体检测系统的速度和准确率损失函数,并通过改进模型架构、训练技术等方法,将模型的准确率提升了 7.7%,速度提升了 30%。作者继续提出了简单的缩放策略来探索速度和准确性之间的权衡,产生了两个 Pareto 曲线。最后,作者显示出 ResNet 架构在检测和实例分割系统中的性能要优于 EfficientNet。
Jun, 2021
YOLOv7 是一种实时目标检测器,其速度和精度表现均优于已有模型,且只在 MS COCO 数据集上进行训练。
Jul, 2022
本研究提出基于卷积神经网络的物体检测系统,使用基于贝叶斯优化的搜索算法和结构化 loss 进行物体定位,实验证明两种方法的结合优于先前的最先进方法。
Apr, 2015
使用随机初始化的标准模型,在 COCO 数据集上进行的目标检测和实例分割,结果不劣于它们的 ImageNet 预训练模型,证明预训练模型并不一定能提高模型最终的准确性。
Nov, 2018
研究表明,在目标检测中固定经初始化的特征提取器可有效提高检测模型的性能,并节省计算资源。
Apr, 2022
本文介绍了一个公开的 py-faster-rcnn-ft 软件库,它可以用于微调 VGG_CNN_M_1024 模型来识别 Microsoft COCO 数据集中的自定义图像子集,这种实现可以随机选择包含微调模型类别中至少一个对象的图像。
Sep, 2017
通过利用预训练深度模型进行微调,从而实现多种视觉任务的最佳性能表现,本文研究了许多影响目标检测微调性能的因素,提出了基于视觉相似类群的分层特征学习方案,在不增加测试阶段的计算成本下,本方法在 ImageNet 目标检测数据集上获得了 4.7% 的绝对 mAP 改进。
Jan, 2016
文章分析了卷积神经网络在物体检测任务上的预训练方法对小规模数据集的图像分类、语义分割和物体检测等任务的影响,并得出了四个关键结论。
Apr, 2019