- 磁共振成像重建中无监督去噪扩散模型的不稳定性
通过研究发现,即使微小的最坏情况扰动由替代模型传递而来,去噪扩散模型仍然能够生成可能误导临床医生的假组织结构,这种扰动的可转移性表明由于磁共振系统的不完善或其他噪声源,图像重构的鲁棒性可能会受到损害。此外,在更大的扰动强度下,扩散模型会产生 - 低层视觉中的扩散模型:概述
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后 - NIVeL: 文本到向量生成的神经隐式向量层
NIVeL 通过在一种可编辑、可分解图层的基础上使用神经隐式场,将图形向量表示问题重新解释为一种中间领域,从而解决了直接应用扩散模型在向量图形领域的挑战,得到了明显优于现有技术的文本到向量图形的结果。
- 医学图像翻译的自一致递归扩散桥
医学图像翻译中,自洽递归扩散桥 (SelfRDB) 通过使用以目标图像为基础、源图像为参照的前向过程,以及噪声调度和采样过程等创新方法,提供了优越的性能。
- 使用分层扩散笔简化图像编辑
基于层次扩散刷子的实时图像编辑技术结合了图像编辑概念,通过精细的区域导向修改中间去噪步骤,保持输入图像的完整性和上下文,并在高端消费级 GPU 上在 140 毫秒内呈现 512x512 图像的单个编辑,从而实现实时反馈和候选编辑的快速探索。 - 在场景中根据文本控制生成人类互动动作
基于去噪扩散模型,我们提出了一种用于文本控制的场景感知运动生成方法。该方法通过预训练场景不可知的文本到运动扩散模型,并利用包含详细场景信息的增强数据对模型进行微调,产生逼真多样的人 - 场景互动。
- 三维健康脑组织修复的去噪扩散模型
通过探索和扩展去噪扩散模型,本研究实现了对健康三维脑组织的一致修复,评估了其在磁共振影像中的回填效果,并在脑组织分割任务中优于现有的病变填充方法。
- 物理相关扩散模型
通过在模型训练过程中加入约束条件使其生成的样本更符合所施加的约束,从而提高生成样本与约束的一致性,且相较于现有方法有更好的性能且不影响推断速度;该方法还可以自然地防止过拟合。
- 二进制任务中的二进制噪声:用掩蔽伯努利扩散实现无监督异常检测
基于潜在伯努利扩散模型的新颖快速非监督异常检测方法,通过自编码器将输入图像压缩成二进制潜在表示,使用伯努利噪声进程的扩散模型从扰动的潜在空间进行训练以恢复二进制潜在表示,并基于这些概率提出了基于掩蔽算法来改进异常检测评分,具有超越其他基于扩 - 分治后验采样用于去噪扩散先验
利用去噪扩散模型(DDM)作为先验来解决逆贝叶斯问题的兴趣最近显著增加。本研究采用不同方法,利用 DDM 先验的特定结构定义了一组中间和简化的后验采样问题,相比以前的方法,降低了近似误差。我们通过使用合成示例和各种图像恢复任务来经验性地展示 - DiffSF:场景流估计的扩散模型
提出了结合转换器的场景流估计与去噪扩散模型的 DiffSF 方法,通过扩散过程和逆过程,能够显著提高预测的鲁棒性并实现对输出不确定性的测量,从而在标准场景流估计基准测试中取得先进的性能。
- 基于扩散模型的图像编辑:一项综述
调查论文对使用扩散模型进行图像编辑的现有方法进行了全面的概述,包括理论和实践方面,并从多个角度对这些作品进行了彻底分析和分类,介绍了学习策略、用户输入条件以及可以实现的特定编辑任务的组合。此外,对图像修复和扩展进行了特别关注,并探讨了早期的 - 基于扩散的文本转语音模型的语义潜空间
在语音合成领域中,噪声扩散模型(Denoising Diffusion Models,DDMs)的整合应用日益增多。尽管其音频质量出色,但其语义能力的程度未知,并且控制其合成语音的音色属性仍然具有挑战性。受到图像合成的最新进展的启发,我们探 - 分类扩散模型
这项研究提出了基于 Classification Diffusion Models(CDMs)的生成技术,通过采用去噪扩散模型(DDMs)的形式来训练模型并使用分类器预测添加到干净信号中的噪音量,实现了更好的去噪效果以及与图像生成中的最佳结 - 目标分数匹配
该论文介绍了利用目标分数的知识来改进 Denosing Score Matching 算法,在低噪声水平下取得更好的评估分数的效果。
- 粒子去噪扩散采样器
利用新颖的评分匹配损失,我们提出了一种基于粒子迭代方案的粒子去噪扩散取样器(PDDS),它能够在温和假设下提供渐近一致的估计,我们在多模态和高维取样任务上演示了 PDDS。
- 解构用于自监督学习的去噪扩散模型
我们研究了最初用于图像生成的去噪扩散模型(DDM)的表示学习能力。我们的研究目的是逐步分解 DDM,将其转化为经典的去噪自编码器(DAE)。我们观察到现代 DDM 的很少组件对于学习良好的表示是至关重要的,而许多其他组件则不是必要的。我们的 - 频率 - 时间扩散与神经元细胞自动机
通过引入 FourierDiff-NCA 来解决当前 NCA 架构的瓶颈,将扩散过程从傅里叶域开始并在图像空间中完成,进而加速全局通信。
- AAAI基于几何优化的去噪扩散模型用于三维分子生成
提出了一种名为几何促进分子扩散(GFMDiff)的新型分子生成方法,通过引入双轨 Transformer 网络(DTN)和几何促进损失(GFLoss)解决了构成二元边和模型分子几何形状的多体间相互关系的建模问题。在现有基准上的全面实验证明了 - 受限先验生成恢复
本研究提出一种方法,通过给待恢复的输入图像添加噪声并进行去噪来使预训练的扩散模型自适应于图像恢复任务。方法基于观察到生成模型空间需要受到约束的原则,通过使用一组捕捉输入图像特征的锚点图像对生成模型进行微调,从而实现受约束的空间。我们通过对比