关键词cnn-based architectures
搜索结果 - 4
- 探讨视觉变换器在医学图像分类中对标签噪声的稳健性
医学图像分类数据集中的标签噪声严重影响了受监督深度学习方法的训练,削弱了其泛化能力。本文研究了 Vision Transformer (ViT) 相对于 CNN 的鲁棒性,以及其处理医学图像分类中标签噪声的能力,并使用两个医学图像分类数据集 - ICCV上下文化本地视觉嵌入的自监督学习
我们提出了 Contextualized Local Visual Embeddings(CLoVE),一种用于密集预测任务的自监督卷积方法,它学习适用于密集预测任务的表示。CLoVE 通过优化单一损失函数来学习从卷积神经网络(CNN)编码 - 一种轻量级的领域自适应绝对位姿回归器,使用巴洛双子目标
提出了一种面向绝对姿态回归的领域自适应训练框架,基于生成方法实现场景图像的不同领域的数据增强,并在回归头中探究了空间和通道注意力对旋转预测的有效性。结果表明,该方法在效率和性能方面都优于基于 CNN 的架构,并可适用于不同领域。
- 基于模型集成的纹理提取方法用于改善分类
本研究提出了一个框架,该框架将多种基于纹理的技术与 CNN 主干结合起来,以提取与图像纹理相关联的最相关特征,使模型可以以自我选择的方式进行训练,并在几个基准数据集上展现了最新的成果。