- MEDDAP:通过多样化增强流程来增强医疗数据集
通过结合稳定扩散模型和超声波应用的精调方法,MEDDAP 管道能够扩充现有的小数据集,并生成具有信息量的标记样本,同时 USLoRA 方法在稳定扩散模型中实现选择性精调权重以提高数据集多样性,并在处理未知数据集时表现出卓越性能。
- 人像风格化框架中的肤色感知与裸露识别
该研究提出了一种肖像风格化框架,结合了一个裸露内容识别模块(NCIM)和一个肤色感知肖像风格化模块(STAPSM),成功地解决了肖像风格化中的输入内容过滤和肤色特征表达的挑战,满足了实际应用的关键需求。
- 无需训练的非刚性编辑中的时间感知采样的潜在倒置
通过文本引导的非刚性编辑的培训自由方法,提出了一种利用稳定扩散的非刚性编辑的方法,旨在提高身份保留质量而不损害可编辑性。通过文本优化、潜在反转和时间步感知文本注入采样三个阶段来实现该方法。通过广泛的实验验证了该方法在身份保留、可编辑性和美学 - 使用稳定扩散模型合成类型 - B 主动脉夹层的 CTA 图像数据
利用稳定扩散模型基于用户定义的文本提示微调,仅通过有限数量的 CTA 图像作为输入,探索生成合成心脏 CTA 图像的可能性,并通过定量分析和定性评估进行了综合评估,结果表明使用 Text to Image (T2I) 稳定扩散模型调优后能够 - ICLREmerDiff:扩散模型中的新兴像素级语义知识
使用稳定扩散模型从特征图中提取语义信息,构建高分辨率细分割地图,以展示像素级语义知识的存在。
- 通过有针对性的攻击揭示稳定扩散中的漏洞
本研究针对 Stable Diffusion 模型的脆弱性,提出一种生成特定图像的对抗性提示框架,并通过揭示导致模型脆弱性的机制来证明方法的有效性。
- 稳定扩散的鲁棒图像水印技术
ZoDiac 使用预训练的稳定扩散模型将水印注入可训练的潜空间,从而产生出在向量空间中可靠检测到的水印,对抗各种水印攻击具有 98% 以上的检测率和不超过 6.4% 的误判率,并超越先进的水印处理方法,展示了稳定扩散作为一种强大的鲁棒水印处 - 文本到图像传播模型的版权保护数据集与基准
该研究提供了第一个大规模标准化的数据集和基准库,以及评估版权保护方法有效性的一套评估指标。
- SinMPI: 从单图像中生成扩展的多平面图像的新观点合成
提出了 SinMPI 方法,通过扩展的多平面图像作为 3D 场景表示,使用稳定扩散生成超出视野内容并优化多平面图像,从而显著扩展了透视范围,生成高质量的新视图图像。
- 基于遥感分割 - GAN - 扩散的公园绿地全过程生成设计框架
利用人工智能算法推动生成设计的发展在迅速进行。当前研究存在两个研究空白:1)大多数研究只关注设计元素之间的关系,对场地的外部信息关注较少;2)GAN 和其他传统的生成算法生成的结果分辨率低,细节不足。为了解决这两个问题,我们结合了 GAN、 - 基于 LoRA 增强的导向扩散模型蒸馏
我们的研究探索了一种新颖的方法,将低秩适应性(LoRA)与模型蒸馏相结合,以有效地压缩扩散模型。该方法不仅减少了推理时间,还减轻了内存开销,甚至在应用蒸馏之前就显著降低了内存消耗。结果是显著减少了由蒸馏过程导致的推理时间,并且内存消耗减少了 - COCO 和 Weed 数据集的稳定扩散
通过稳定扩散模型生成高分辨率图像,并利用这些图像提高检测模型的性能,这项研究有助于将稳定扩散模型应用于不同领域的分类和检测任务。
- 稳定扩散生成图像中非标准手势的检测与修复
我们介绍了一种处理稳定扩散生成的手部图像中解剖学不准确性的流程。我们首先构建了一个专门针对手部异常的数据集,以有效训练我们的模型。一个经过微调的检测模型对这些异常的精确定位至关重要,确保了有针对性的修正。身体姿势估计有助于理解手部的方向和位 - 探索文本到图像基础模型在下游应用中的社会偏见
使用合成图像的方法探索扩散模型的两个应用领域(图像编辑和分类),从而揭示了目前最先进的开源文本到图像模型 Stable Diffusion 中存在的具有意义且显著的交叉社会偏见,这对于下游任务和服务中文本到图像基础模型的不加思考的应用提出了 - 稳定的暴露扩散:从提示到图像的性别偏见
该研究通过引入一个评估协议,旨在自动分析性别指示对稳定扩散图像的影响,从而为生成模型中的偏见和性别失衡问题做出贡献。研究发现性别指示不仅影响性别呈现,还影响生成图像中的物体和布局的表现,揭示出稳定扩散中微妙的性别偏见。
- 保护性扰动是否可以防止个人数据受稳定扩散的侵害?
在这篇论文中,我们系统评估了使用扰动在实际威胁模型下保护图像的方法,并介绍了一种能够在最大程度上保留原始图像结构的净化方法。实验证明,稳定扩散可以有效地从净化后的图像中学习,并且对各种保护方法具有良好的适应性。
- SD-NAE:稳定扩散生成自然对抗样本
通过稳定扩散技术合成的自然对抗样本(SD-NAE)为训练模型提供有效而有用的评估数据,从而可能推动更强大的深度学习模型的发展。
- 神经引导:优化文本到图像生成的自适应框架
通过使用预先训练的语言模型生成与人类专家设计相似的提示语,NeuroPrompts 自适应框架可以改善文本到图像模型生成结果的质量,并提供用户对风格特征的控制。研究通过创建一个与 Stable Diffusion 相关的互动应用程序,展示了 - 稳定扩散提高对抗转移性
该研究探讨了使用 Stable Diffusion 生成的数据来增强对抗攻击的传递性,提出了一种基于 Stable Diffusion 的新型攻击方法,并提供了一个快速变体,通过实验证明该方法在对抗性传递性方面优于现有方法,并且与现有的基于 - 基于基础模型的医学图像一次性定位和分割
通过测试在自然图像上训练的各种预训练的视觉 Transformer 和稳定扩散模型,本研究证明它们在医学图像的对应问题和语义分割任务上能够取得良好的性能。