- 几何数据增强技术在花粉分类从显微图像中消除分布偏移中的应用
该论文研究了在野外使用低成本相机传感器对显微图像中的花粉粒子进行分类时的分布漂移问题,提出了两种新的几何图像增强技术,通过平衡形状和纹理信息并去除干扰细节,显著缩小了训练集和测试集上模型性能的准确性差距,经过多种模型架构的广泛评估,这些几何 - MD-IQA: 学习多尺度分布式图像质量评估与半监督学习在低剂量 CT 中的应用
通过引入多尺度分布回归方法、设计双分支对齐网络以及半监督学习,我们提出的方法在深度学习为基础的医学图像质量评估方面取得了显著的进展。
- 通过潜在语义特征协同注册进行甲状腺结节的超声图像分割
提出了一种通过新型共同注册网络实现的甲状腺结节分割框架 ASTN,通过从图谱和目标图像中提取潜在的语义信息,并利用深度特征完成甲状腺超声图像中结节的共同注册,确保解剖结构完整性,并减少不同设备造成的图像整体差异对分割的影响,同时通过提供图谱 - CIParsing: 将因果属性统一到多个人的解析中
通过引入因果关系理论,提出了一种 CIParsing 人体解析模型,通过构建潜在因果因素的表示来改善多人解析模型的泛化能力。
- 通过虚拟风险最小化轻松实现模型泛化
本文介绍了 Dummy Risk Minimization(DuRM)技术,一种简单易用的方法来提高 Empirical risk minimization(ERM)的广义性能,该方法通过扩大输出 logits 的维度并使用标准梯度下降进行 - KDDViT2EEG: 基于混合预训练视觉 Transformer 的 EEG 数据利用
本研究展示了在脑电图(EEG)回归任务上,以 ImageNet 为预训练数据的混合 Vision Transformer(ViT)模型的应用。通过与其他模型进行比较,包括没有 ImageNet 权重的相同结构 ViT 模型,在 EEG 数据 - 推广图 ODE 以跨环境学习复杂系统动力学
通过学习多智能体系统动力学,我们提出了 GG-ODE(广义图形常微分方程)机器学习框架,使用神经常微分方程(ODE)通过图神经网络(GNN)捕捉智能体之间的连续交互,并假设不同环境下的动力学都受到相同物理定律的支配。通过实验证明,我们的模型 - 无监督特征学习与新兴数据驱动的原型特性
介绍了一种在双曲空间进行无监督特征学习的算法,利用距离表示图像相似性和图像原型性,有效地减少了样本复杂性,提高了模型泛化性和鲁棒性。
- 增强颜色以外的特征以进行域泛化分割
本文提出了一种基于随机图像颜色增强和特征空间分布增强的域通用语义分割方法,通过对图像或特征进行性质适应性调整来增广数据集,从而提高模型的泛化性能。实验结果表明,该方法在现有方法中表现最佳。
- 推理时音频场景分类的领域信息控制
本文在声学场景分类任务中使用可控门适配器 ConGater,以使模型对设备领域漂移具有选定的适应性并体现出最大的泛化能力。
- 探究数据增强在不平衡数据中的作用
本研究通过实验检验了数据增强对神经网络、支持向量机和逻辑回归模型的影响,发现它可以帮助模型更好地泛化,在处理不平衡数据分类问题时效果显著。其中一个机理是通过促进数据的差异性,使得机器学习模型能够将数据的变化与标签关联起来,从而提高了模型的泛 - 多模态模型微调中减少虚假相关性的影响
该论文提出了一种利用多模态模型中的不同模态来检测和明确区分有影响的类别中的虚假属性的方法,通过表达语言来体现虚假关系的多模态对比损失函数,在 CLIP 上实验结果表明,这种干预可以有效地提高模型的准确性。
- CVPR利用域凸博弈改善泛化
本研究提出了一种新的域通用泛化(DG)解决方案,将其重新构建为域之间的凸博弈,以及使用基于超模的正则化项来鼓励每个多样化的域增强模型泛化能力,并构造一个样本筛选器来消除低质量样本的影响, 从而证明我们的方法的合理性和有效性。
- 检测超过阈值的不确定性(DUET):对抗贴片本地化器
本研究提出了一种基于不确定性的对抗性贴片定位器,通过采用 DUET 算法来量化预测不确定性以查明对抗性贴片所在的图像区域,以允许后处理补丁避免或补丁重建,这对于自动驾驶汽车和医学成像等安全敏感应用至关重要。该研究还表明,在贝叶斯神经网络的不 - CVPR基于学生 - 教师模型的去泛化自编码器知识蒸馏
该研究提出了一种通用到特定蒸馏法 (G2SD),以在受掩膜自编码器预训练的大型模型的监督下激发小型 ViT 模型的潜力,从而在图像分类、目标检测和语义分割任务上设置了坚实的基线。
- 基于混合数据增强的调查:分类、方法、应用和可解释性
本文提供了对 Mix-based Data Augmentation 在分类,方法,应用及可解释性等方面的全面调查,为该领域的研究人员提供了有用的方向。
- 寻找基于任务的平坦区域以提高多任务学习
本文研究了多任务学习领域的一种新方法,使用名为 Sharpness-aware Minimization 的训练技术,以提高单任务学习的通用性和多任务学习的性能。实验表明,该方法在多个应用程序中都有很好的表现。
- 医学视觉问答的自监督视觉语言预训练
本文介绍了一种自我监督方法 - 对遮蔽图像建模、遮蔽语言建模、图像文本匹配和图像文本对齐进行对比学习的 M2I2 方法,应用于医学图像字幕数据集的预训练,并对下游医学 VQA 任务进行微调。该方法在三个公共医学 VQA 数据集上实现了最先进 - 通过激活函数的内在维度将正则化和泛化联系起来
本文研究了模型的内在维度对其泛化能力的影响,通过对验证集和训练集的表现进行分析,提出了通用的规则以改善在一个模型内提取特征数据时可能遇到的问题。
- 特征削弱:临域数据增强分类
该论文提出了一种称为特征削弱的数据增强方法,可有效提高深度学习模型的分类性能和泛化能力,同时也稳定模型训练并加速模型收敛,特征削弱还能提高模型的鲁棒性。