- 参数化量子电路中基于扩散的量子噪声抑制
该研究论文探讨了参数化量子电路(PQCs)与量子噪声的关系,并提出了一种基于扩散的学习方法,以减小 PQCs 中的量子噪声并降低特定任务的误差。通过实验证明了该学习策略的高效性,并在量子噪声情景中在分类任务上取得了最先进的性能。
- 医学图像的亮度调整
无需训练的 UniMIE 扩散模型通过依赖单个预训练的 ImageNet 模型,在各种医学图像模态中展示了无监督增强能力,具有更好的质量、鲁棒性和准确性,有助于加速诊断工具和定制化治疗计划的发展。
- CVPRFlowIE: 通过修正流实现高效图像增强
FlowIE 是一个基于流的简单而高效的图像增强框架,通过估计直线路径从一个分布到高质量图像,使用条件矫正流构建线性的一对多传输映射,加速推断,实现对预训练扩散模型丰富知识的充分利用,同时还设计了一种更快的推断算法,通过使用中点切线方向来优 - 使用扩展的注意力实现视频中的时态一致的对象编辑
使用预训练的图像修复扩散模型,通过替换自注意力模块以创建帧级依赖关系,我们提出了一种编辑视频的方法,以确保编辑信息在所有视频帧中保持一致,从而在对象重定向、对象替换和对象移除等多个视频编辑任务中展示了该策略的卓越性能。
- 扩散演员 - 评论家:将受约束策略迭代形式化为离线强化学习的扩散噪声回归
这篇论文介绍了一种名为 Diffusion Actor-Critic(DAC)的方法,用于解决离线强化学习中价值函数过高估计的问题,并通过扩散模型来表示目标策略,进而通过 Kullback-Leibler(KL)约束策略迭代来规范化目标策略 - DiffPhysBA: 基于扩散的真实世界个人重新识别物理后门攻击
通过使用扩散模型生成现实中的配饰作为后门触发器,本文介绍了一种新颖的基于扩散的物理后门攻击方法 (DiffPhysBA),该方法采用无需训练的相似度引导采样过程,以增强生成触发器和物理触发器之间的相似性,从而在数字和物理领域中具有超过 90 - 通过快速扩散反演进行盲图像恢复
通过使用预训练的扩散模型,我们提出了一种盲图像恢复方法 BIRD,它在优化退化模型参数和恢复图像的同时,通过在数据流形上提出新的采样技术,将图像恢复任务转化为输入噪声空间中的优化问题。实验证明,该方法在多个图像恢复任务上实现了最先进的性能。
- EASI-Tex:基于单张图像的边缘感知三维网格纹理生成
我们提出了一种新的方法来实现单图像网格纹理化,该方法利用适当的条件扩散模型,将对象的纹理从单个 RGB 图像无缝地转移到给定的 3D 网格对象。
- 扩散演员 - 评论者与熵调节器
提出了一种名为 DACER 的在线强化学习算法,通过利用扩散模型的能力来拟合多模态分布,增强策略的表征能力,并提出了一种估算扩散策略熵的方法,在 MuJoCo 基准和多模态任务上实验证明了算法的最先进性能。
- 通过明确的前向 - 后向桥接对扩散模型进行条件化
将条件模拟表达为关于偏微分方程桥的推断问题,提出了高效、有原则的粒子 Gibbs 和伪边缘抽样器方法用于目标条件分布。
- Score-CDM: 分数加权卷积扩散模型用于多元时间序列补全
使用得分加权的卷积扩散模型 (Score-CDM),结合了得分加权的卷积模块 (SCM) 和自适应接收模块 (ARM),以适应性地均衡局部和全局时间特征进行多变量时间序列 (MTS) 数据的不完全恢复,通过在时域和频域中捕捉全局和局部时间特 - Diffusion-RSCC: 遥感图像中变化描述的扩散概率模型
遥感图像变化标题生成(RSICC)旨在生成人类化语言,描述双时相遥感图像对之间的语义变化。我们提出了一种概率扩散模型来解决传统变化标题生成任务中的像素级差异对地形变化定位的影响,并在 LEVIR-CC 数据集上进行了广泛实验,展示了我们 D - CVPR自定义您自己的配对数据的几轮方式
现有的图像编辑解决方案存在多个问题。尽管能够取得显著令人满意的生成结果,但一些有监督的方法需要大量成对的训练数据,从而极大地限制了它们的使用。其他的无监督方法充分利用大规模预训练的先验条件,在先验条件训练的领域中受到严格限制,在超出分布范围 - InterAct: 捕捉和建模日常场景中两人之间逼真、富有表情和互动的活动
我们提出了一种在日常情景中准确捕捉和表达两个人之间交互行为的问题的解决方案,与先前的工作不同,我们同时模拟两个人的活动,并针对常常持续较长时间的以目标驱动、动态和连贯性交互为目标,我们捕捉了一个名为 InterAct 的新数据集,其中包含 - 基于扩散模型的测试时间图像适应性用于鲁棒皮肤病变分类
我们提出了一种测试时间图像适应方法,通过同时更新和预测测试图像来提高模型在测试数据上的准确性,通过扩散模型将目标测试图像反投影到源域,设计结构指导模块通过低通滤波添加细化操作,用于正则化扩散以保留结构信息,并引入自整合方案自动调整对适应和未 - MM使用深度生成模型重新考虑多用户语义通信
在这篇文章中,我们提出了一个新的生成语义通信框架,针对多用户场景进行了优化,利用扩散模型在接收方填充丢失的信息,通过彻底的实验评估展示了这种创新性的扩散模型的能力和所提出框架的有效性,为基于 GenAI 的下一代通信发展指明了方向。
- 无限纹理:基于文本引导的高分辨率扩散纹理合成
从文本提示生成任意大小的纹理图像的新方法,通过精调扩散模型实现单一 GPU 上任意分辨率的输出纹理图像,并展示了生成纹理在 3D 渲染和纹理转换中的两个应用。
- 稳定的签名是不稳定的:从扩散模型中消除图像水印
稳定签名是一种新的数字水印方法,根据扩散模型解码器的参数将水印嵌入生成的图像中,但我们提出了一种攻击方法可通过微调扩散模型有效去除水印,同时保持生成图像的视觉质量,结果表明稳定签名不如先前认为的那样稳定。
- 利用扩散先验生成钢表面缺陷图像样本,用于缺陷识别
针对钢表面缺陷图像生成的数据不足问题,提出了一种稳定的钢表面缺陷图像生成方法,通过在生成过程中对数据分布进行参数调整和采用钢表面图像导向的生成方法,以解决钢表面图像与生成图像的分布差异问题,并在钢表面缺陷数据集上展示了出色的样本生成和识别模 - DiffMap: 使用扩散模型增强地图分割中的地图先验
构建高清地图是实现自动驾驶的关键需求之一。本研究提出了 DiffMap,一种利用潜在扩散模型对地图分割掩码的结构先验进行建模的新方法,可以提高语义分割方法的性能并有效修正分割输出中的结构错误,进而改进生成地图的质量。通过广泛的可视化分析,我