- 通过特征空间增强和迭代学习实现长尾图像生成
基于稀疏嵌入和 K-NN 方法,我们提出了一种基于预训练的稳定扩散模型的图像增强方法,以解决图像生成中的数据不平衡问题。
- 政策梯度驱动的噪声遮罩
本研究提出了一种学习生成特定噪声遮罩的预训练流程,旨在改善在多模态和多器官数据集上的性能,实验证明中间模型的微调能够在分类和概念任务上持续优于传统训练算法。
- 人脸关键点检测的基准焦点增强
通过使用深度学习方法和图像增强技术,本文提出了一种有效的面部特征检测方法,采用 Siamese 架构和 Transformer + CNN 网络作为骨干结构,通过高级特征表示的集合学习来改善面部特征检测的性能。经过大量实验证明,该方法在各种 - 大模型时代的数据增强调查
大型模型驱动的数据增强方法的综述,包括图像增强、文本增强和配对数据增强三个主要类别以及相关的数据后处理技术和应用领域,评估了大型模型驱动的数据增强在不同场景下的成功和限制,并提出了未来研究的挑战和方向。
- MGAug: 图像变形潜空间的多模态几何增强
本文提出了一种基于多模态几何变换的深度学习模型,通过学习隐空间中的变形变换,从隐含的图像变换分布中生成变形图像,进而在分类和分割任务中获得显著提高的预测准确性。
- OASIS:联邦学习中的主动重构攻击抵消
本文提出了基于图像增强的防御机制 OASIS,以有效抵抗主动重构攻击,同时保持模型性能。
- 利用自动增强和搜索优化技术改进基于 Transformer 的乳腺癌诊断分割
这篇论文介绍了一种将自动图像增强选择(RandAugment)与搜索优化策略(基于树的 Parzen 估计器)相结合的方法,用于确定图像增强数量和相关增强参数的最佳值,从而提高分割性能。在乳腺癌组织切片中经过实证验证后,我们的结果表明,这种 - 几何数据增强技术在花粉分类从显微图像中消除分布偏移中的应用
该论文研究了在野外使用低成本相机传感器对显微图像中的花粉粒子进行分类时的分布漂移问题,提出了两种新的几何图像增强技术,通过平衡形状和纹理信息并去除干扰细节,显著缩小了训练集和测试集上模型性能的准确性差距,经过多种模型架构的广泛评估,这些几何 - 自动扩展扩散的视觉数据集
本研究介绍了一种基于自然语言描述的图像增广方法(ALIA),通过大规模视觉模型与语言模型的结合,自动生成域名描述,实现对样本数据的增广。该算法有效提高了训练数据的多样性,经过测试在细粒度和复杂分类中表现良好。
- 基于增强的域泛化用于语义分割
本研究系统地研究了简单、基于规则的图像增强方法(如模糊、噪声、色彩抖动等)对深度神经网络(DNNs)的领域内外泛化能力。 实验结果表明,对多个不同的图像增强进行组合优于单独使用单个图像增强,并且与最先进的领域泛化方法相比表现相当。
- CVPR单域泛化的渐进式随机卷积
研究提出了一种逐渐堆叠具有小卷积核的随机卷积层的渐进式方法来解决 RandConv 结构的局限性, 并将基本随机卷积层开发成一个包括可变形偏移和仿射变换的随机卷积块,以支持纹理和对比度的多样化。该策略在单一领域泛化基准测试中表现优异。
- 朝向可组合的潜在空间扩增分布
提出了一种基于变分自编码器架构的可组合的潜在空间图像增强框架,它使用一种新方法将增强应用于潜在空间本身的线性变换,这使得变换可以轻松组合或反转,并且可以通过转移潜在空间来修改性能,为研究人员和实践者提供了更大的控制和几何可解释性。
- ECCVConMatch: 带置信度引导的连贯性正则化半监督学习
本文介绍了一种名为 ConMatch 的新型半监督学习框架,它在图像的两个强大的增强视图的模型预测之间智能地利用一致性正则化,权重由伪标签的置信度确定。该方法通过弱增强视图作为锚点,提出了新的伪标签置信度度量方法,包括非参数方法和参数方法。 - 使用连续标记的增强方法检测异常
这篇论文提出了一种利用简单学习过程训练轻量级卷积神经网络的方法,将异常检测问题视为监督回归问题,并使用两个可分离连续值分布来标记正常和异常的数据,通过图像增强技术创造出一个独特的异常样本集,并在图像和视频数据集的异常检测实验中展现了该方法的 - MM基于迁移学习的深度神经网络进行脑肿瘤图像多分类
本文主要研究基于迁移学习的深度神经网络对脑瘤图像进行分类,通过图像增强和特征提取等方法,最终实现对三种最常见类型的脑瘤(meningioma,glioma 和垂体)的分类,其分类准确率达到 96.25%。
- 深度学习图像增强技术的全面调查
本文调研了基于深度学习的图像增强方法,并将其分为三类:无模型、有模型和优化策略。同时,讨论了常见应用的趋势以及使用组和核理论以及无监督学习实现的图像增强方法。
- CVPR通过基于对象的多样化输入提高有针对性对抗样本的可转移性
使用物体为基础的多样化输入方法可以有效地增强针对黑盒模型的对抗攻击成功率,其难以被原模型检测到,这体现在将对抗样本绘制在三维物体上,通过多个源物体的集成和随机的视角条件,可以有效地进行干扰。在实验结果中,这种方法将平均有针对性攻击成功率从 - FitVid: 像素级视频预测中的过拟合
本文提出一个名为 FitVid 的视频预测模型,通过提高参数效率和使用图像增强技术来缓解过拟合现象,从而在四个不同的视频预测基准测试中表现出优秀的质量。
- ICMLSECANT: 自学习克隆以实现视觉策略的零样式泛化
本论文提出了一种名为 SECANT 的新型自我专家复制技术,旨在学习从弱增强到强增强的映像数据,以提高其对视觉变化的鲁棒性,在包括 DeepMind Control,机器人操作,基于视觉的自主驾驶和室内物体导航在内的四个具有挑战性的领域,S - 使用 InceptionV3 迁移学习进行口罩检测
提出了一种基于迁移学习和图像增强技术的深度学习模型来识别不戴口罩的人,该模型在模拟数据集上的训练和测试中表现出了很高的准确性。