- 超声图像重建的快速采样生成模型
利用新型采样框架和先进的扩散模型,我们提出了一种从射频数据中重建图像的方法,以加速高质量图像的生成过程。通过实验评估,我们的方法在单平面波条件下胜过了具有 75 个平面波空间相干合成的传统延迟和求和 (DAS) 技术。
- $ρ$-Diffusion:一种基于扩散的计算物理密度估计框架
提出了一种新方法 —— 密度扩散($
ho$-Diffusion),该方法可以用于物理学中的多维密度估计,并能通过任意数量的感兴趣的物理参数来进行条件建模。
- MVDD:多视角深度扩散模型
利用多视角深度,通过 MVDD 扩展扩散模型以生成高质量的 3D 形状,并通过增强视图之间的一致性及深度图对齐来提供卓越的 3D 形状生成和深度完成能力,以及作为下游任务的 3D 先验。
- 改进的高效二阶段去噪扩散电力系统测量恢复对抗假数据注入攻击和数据丢失
本文提出了一种改进的两阶段去噪扩散模型(TSDM),用于识别和重建具有各种测量不确定性的测量。该模型的第一阶段包括基于分类器的条件异常检测组件,而第二阶段涉及基于扩散的测量填补组件。此外,所提出的 TSDM 采用精确的均值和最优的方差来加速 - Resfusion: 先验残差噪声嵌入去噪扩散概率模型
最近,通过生成以输入图像为条件的分割掩模,去噪扩散概率模型广泛应用于图像分割。然而,以往的研究无法无缝地将现有端到端模型与去噪扩散模型结合使用。我们提出了一种新的去噪扩散过程,Resfusion,通过马尔可夫过程在似然输出和实际输出之间建立 - 扩散生成图像中的弱监督深度伪造定位
通过使用基于解释、局部分数或注意机制的三种方法,并利用 Xception 网络作为共同的骨干架构,我们将任务定为弱监督定位问题,并在方法选择、监督类型、数据集和生成器等方面进行了仔细分析;我们的研究通过构建数据集,其中只有一个组件发生变化, - 减少噪声扩散模型蒸馏中的空间拟合误差
通过分析偏差 - 方差分解和实验观察,我们提出了一种基于空间拟合误差减少的蒸馏模型(SFERD),该模型利用教师模型的注意力引导和设计的语义梯度预测器来降低学生模型的拟合误差,从而在少量函数评价中实现高质量的样本生成,并在 CIFAR-10 - 量子电路与扩散模型综合
量子计算中的生成机器学习模型和去噪扩散模型在产生期望的量子操作方面具有优势,并在纠缠生成和酉编译等任务中展示出灵活性和潜力。
- DiffRef3D:一种基于扩散的三维物体检测提案细化框架
DiffRef3D 是一种新颖的框架,采用了首次将扩散流程应用于使用点云的三维物体检测,通过将噪声逐渐添加到提案和目标物体之间的残差,并将噪声残差应用于提案以生成假设,然后通过迭代步骤对假设进行精确的盒子预测,从而在现有的三维物体检测模型中 - 图像、3D 动画和视频的条件生成建模
通过探索条件生成模型的新的形式和在图像、3D 动画和视频中的创新应用,本论文试图在计算机视觉领域推动创新。我们的研究聚焦于提供噪声和视觉数据的可逆变换的体系结构,并应用编码器 - 解码器结构进行生成任务和 3D 内容操作。在所有情况下,我们 - 可解释的信息分解扩散
通过使用去噪扩散模型,我们可以条件生成和密度建模复杂关系,如图像和文本,并通过信息分解揭示学到的细粒度关系,进而提出了许多应用,包括无监督定位图像中的目标和选择性编辑图像时的影响测量。
- MM宇宙模拟的随机超分辨率与降噪扩散模型
近年来,深度学习模型成功应用于增强低分辨率宇宙学模拟的小尺度信息,称为 “超分辨”。我们引入去噪扩散模型作为一种强大的生成模型,用于超分辨宇宙大尺度结构预测(首次在二维中作为概念验证)。通过开发一种新的 “滤波增强” 训练方法,重分配了像素 - ICML扩散生成逆向设计
逆向设计问题可以通过学习仿真、图神经网络以及去噪扩散模型等方法得到有效解决,可用于流体动力学设计挑战中减少对模拟器的调用次数。
- 使用扩散去噪模型的医学图像分割回收训练策略
通过改进训练策略和提出一种新的回收方法,本文旨在解决现有扩散模型在图像分割中的性能问题,实验证明该方法在多个医学影像数据集上显著优于标准扩散训练,改善了性能并与非扩散型监督训练相媲美。
- 基于扩散模型的图像属性编辑的零样本反演过程
零样本反演过程 (ZIP) 是一个框架,将生成的视觉参考和文本引导注入预训练的去噪扩散模型的语义潜空间中,仅使用一个小型神经网络,ZIP 在文本提示的直观控制下产生多样的内容和属性,并对真实图像上的域内和域外属性操作展现了显著的鲁棒性。与最 - 图像逆问题中的可导条件扩散对于离域自适应
我们介绍了一种名为可控条件扩散的新型采样框架,它将去噪扩散模型与可用的测量数据相结合,实现了对多样的成像模态下的离群任务的显著改进,推动了去噪扩散模型在实际应用中的鲁棒部署。
- 小心行动:通过文本指令进行本地图像和场景编辑
我们提出了一种方法来定位文本指令中所隐含的期望编辑区域,并利用 InstructPix2Pix(IP2P)来确定在有和无指令的情况下 IP2P 预测之间的差异,以此差异作为相关性地图。相关性地图传达了每个像素更改的重要性,并用于指导修改,以 - 去噪扩散模型中的头部旋转
利用噪声扩散模型,通过嵌入技术在人脸旋转方面实现了显著的操作和编辑,保留了个体的显著特征。
- 伪装目标检测的扩散模型
本研究提出了一种基于扩散的伪装目标检测框架(diffCOD),该框架将伪装目标分割任务视为从噪声掩码到目标掩码的去噪扩散过程,并采用模型学习来逆转这一噪声处理过程。通过将输入图像先验编码和集成到去噪扩散模型中来加强去噪学习,同时使用注入注意 - ICCV基于迭代扩散模型的真实人脸恢复与扩展
基于去噪扩散模型的迭代学习人脸修复系统(IDM)能够实现真实的人脸修复,具有优秀的性能,同时对图像生成任务也有帮助。