- 混合自然和合成图像用于鲁棒自监督表征
DiffMix 是一种新的自监督学习(SSL)预训练框架,通过结合真实图像和合成图像,采用稳定扩散的变种来增强跨真实 - 合成图像表示的学习,从而提高了 SimCLR、BarlowTwins 和 DINO 等 SSL 方法在各种鲁棒性数据集 - BiVLC: 通过文本到图像检索扩展视觉 - 语言组合性评估
双向视觉语言组合性 (BiVLC) 数据集用于添加由合成文本生成的合成负向图像,从而产生两个图像到文本检索示例和两个文本到图像检索示例,发现当前多模态模型在文本到图像方向上表现不佳。
- 深度任何事物 V2
本研究介绍了 Depth Anything V2,通过使用合成图像替代真实标注图像,提升教师模型的容量,并通过大规模伪标注真实图像来教授学生模型,成功构建了效率更高、准确性更好的多种规模深度估计模型,并构建了通用的评估基准,以促进未来的研究 - 从障碍到机遇:通过合成数据增强半监督学习
通过分析合成图像的问题,本文提出了一种新的 SSL 方法 RSMatch 来解决混合真实和合成图像对 SSL 的影响问题,并通过实验证明 RSMatch 能够更好地利用未标记图像中的合成数据来提高 SSL 性能。
- ComFace:人脸对比的合成数据人脸表示学习
通过使用合成图像来捕捉人脸图像中的个体间面部差异和个体内面部变化,我们提出了一种名为 ComFace 的人脸表征学习方法,用于医疗、保健和情感识别领域的个体面部变化的监测。我们的方法在只使用合成数据进行训练的情况下,实现了与使用真实图像进行 - 利用 GAN 增强医学图像从有限数据中合成逼真图像
通过引入生成对抗网络(GANs)的创新方法,我们提出了一种合成医学图像的方法,通过深度卷积神经网络(CNNs)架构的生成器和鉴别器网络以及对抗训练方法,即使在有限的真实医学图像数据训练下,也能生成逼真的合成图像,并成功模拟了真实医学图像的结 - 课程数据蒸馏
本论文提出了一个基于课程设置的数据集蒸馏框架,通过将从简单到复杂的课程进行逐步蒸馏,合理处理合成图像的生成和评估,进一步利用对抗优化改进图像的代表性,提高其在不同神经网络体系结构下的泛化能力和抗噪性,实现了大规模数据集蒸馏的新突破。
- 生成式人工智能时代的合成图像验证:暂有何窍门与何需进一步完善
该研究综述了关于合成图像的检测和归因方法,突出了它们的优点和局限性,同时指出并讨论了该领域的热门话题,概述了未来研究的有希望的方向。
- SIDBench:用于可靠评估合成图像检测方法的 Python 框架
该研究论文介绍了一个基准测试框架,通过集成多个最先进的合成图片检测模型,旨在解决合成图片检测方法在实际应用中与基准数据集之间的差距,并研究在线共享素材中的图像变换对检测性能的影响。
- 利用深度学习文本到图像模型生成合成卫星图像 - 技术挑战及对监测和验证的影响
通过使用新颖的深度学习模型,本研究探索了使用条件机制创建合成卫星图像的挑战,通过真实性和最先进的度量方法评估了结果,并研究了合成数据在遥感中缓解数据不足的潜力,讨论了合成卫星图像在监测和验证方面的意义。
- 利用模拟图像改进深度学习预测及其反向操作
通过使用 L 系统生成的合成图像,可以在培训神经网络进行表型鉴定任务时,通过增加或完全替代真实图像,从视觉上更真实地模拟植物,从而在更好地理解合成图像生成的情况下使用不同数量的真实图像和合成图像进行系统化分析。此外,利用神经网络的预测结果可 - 面向未来的班级增量学习
通过使用预训练的文本到图像扩散模型生成未来类别的合成图像并使用它们训练特征提取器,我们提出的方法改进了无典范类增量学习的最新方法,特别是在只包含少量类别的最困难的情况下。此外,我们还表明使用未来类别的合成样本比使用不同类别的真实数据能够实现 - 基于分割引导的膝关节 X 射线图像生成,使用条件扩散模型
使用条件扩散模型从轮廓和骨骼分割生成膝关节 X 射线照片,并展示了条件采样和条件训练两种方法能够生成逼真的图像,并且条件训练方法表现优于条件采样方法和传统的 U-Net 模型。
- CVPR对扩散合成目标的神经网络稳健性进行基准测试
我们建立了视觉感知稳健性的严格基准,通过合成图像进行评估,引入了生成模型作为数据源来合成具有多样化背景、纹理和材料的困难图像,该基准称为 ImageNet-D,实验结果表明 ImageNet-D 对于多种视觉模型都导致了显著的准确率下降。
- 网络影响操作中的合成图像生成:一种新兴威胁?
人工智能的发展催生了数字内容生成的转变,特别对网络影响操作产生了深远的影响。本文研究了扩散模型等生成深度学习模型在制造令人信服的合成图像方面的潜力和局限性,并对这些工具的可接近性、实用性和输出质量进行了批判性评估,同时分析了它们在欺骗、影响 - MARVIS:动作与几何感知的真实和虚拟图像分割
本研究提出了一种利用合成图像和领域不变信息、运动熵核和极线几何一致性进行真实和虚拟图像区分的新方法。通过创建模拟复杂水面的逼真合成图像,为网络(MARVIS)提供精细训练数据,有效地区分真实和虚拟图像。通过运动和几何感知的设计选择以及全面的 - 合成图像对基于孪生网络的形变攻击检测的影响
研究评估了使用具有半硬损失函数的暹罗网络在形态攻击检测(MAD)中,合成图像对其影响。通过跨数据集评估来测量合成图像的泛化能力。使用传统的 MobileNetV2、MobileNetV3 和 EfficientNetB0 预训练网络作为特征 - AIGCs 对 AI 的混淆:探究和解释大型视觉语言模型中由合成图像引起的幻觉
人工智能生成内容的进化朝着更高质量的方向发展,与人工智能生成内容的不断交互给数据驱动的人工智能社区带来了新的挑战:尽管 AI 生成的内容在广泛的 AI 模型中扮演着关键角色,但它们引入的潜在风险尚未得到充分的审查。本研究突出了由 AI 合成 - 数据无关运算器:一种无需训练的适用于通用深伪造检测的艺术品表示提取器
合成图像、生成对抗网络、假图像检测、数据独立操作、技术水平的优化
- 使用 GAN 生成 3D 心脏超声图像的合成标记数据集的数据增强流水线
通过结合详细的心脏解剖分割模型和真实数据集,利用生成对抗网络(GAN)生成 3D 合成数据集来解决医学成像领域中的数据收集和标注困难,从而应对 3D 心脏超声图像数据稀缺问题,并展示了该方法在分割算法训练中的潜在应用价值。