- CriDiff: 利用生成预训练的 Criss-cross Injection Diffusion 框架进行前列腺分割
本文提出了一个两阶段的特征注入框架 CriDiff,其中包括 Crisscross Injection Strategy (CIS) 和 Generative Pre-train (GP) 方法,用于前列腺分割。CIS 通过高效地利用高和低 - DiffPop: 图像合成中基于真实性导向的对象放置扩散
本文提出了 DiffPop,这是第一个利用可信度引导的去噪扩散概率模型来学习多个对象之间的比例和空间关系以及相应场景图像的框架,通过自我监督的方式训练了一个无引导扩散模型来直接学习对象放置的参数,然后开发了一个人在回路中的管道,利用扩散生成 - 探索文本到图像扩散模型的工作机制
通过研究强潜在扩散概率模型在 T2I 生成过程中的中间状态,发现图像在早期生成阶段主要由文本引导完成,之后概率模型通过自身信息来完善生成图像的细节,并进一步提出了去除文本引导以加速 T2I 生成过程的方法,加速效果达到 25%+
- 基于扩散的图像生成优化线性测量反问题
从一小组线性测量和来自扩散概率模型的图像先验出发,重新审视了从高维信号重构的问题。通过利用通过神经网络训练进行去噪的先验来获得一组优化的线性测量,不同于主成分分析(PCA)和压缩感知(CS),在最小化均方重构误差方面显著改进。而且,通过最小 - 带有扩散模型的车道分割细化
通过改进和扩展分割方法,结合扩散概率模型,提高道路图的质量,特别是在非交叉区域中的连通性,从而优于先前方法。
- 扩散概率多线索水平集用于减少胰腺分割中的边缘不确定性
准确地划分胰腺仍然是一个巨大的挑战。为了克服传统方法和深度学习方法在语义定位和边缘精确性方面的困难,我们提出了一种基于扩散概率模型的多线索水平集方法,命名为 Diff-mcs。通过在粗分割阶段中应用扩散概率模型,我们使用获得的概率分布作为初 - 基于扩散的不完整欧几里得距离矩阵修复方法对分数布朗运动生成的轨迹
使用扩散概率模型测试对损坏图像数据集的不完整欧几里得距离矩阵进行数据补全,研究发现条件扩散生成可以稳定地重现不同 H 指数的缺失 fBm 分布距离的统计特性,并且扩散模型的补全方法在与数据库搜索不同的情况下表现出不同的定性行为,最后运用 H - NAF-DPM: 一个用于文档增强的非线性无激活扩散概率模型
提出一种基于扩散概率模型 (DPM) 的新型生成框架 NAF-DPM,用于恢复被损坏文档的原始质量。通过引入高效无线激活的网络和快速求解常微分方程的采样器,减少了 DPM 的推断时间。实验证明,该方法在像素级和感知相似度度量方面达到了最先进 - 基于扩散概率模型的伪 MRI 引导 PET 图像重建方法
该研究使用扩散概率模型 (DPM) 从 FDG-PET 脑部图像中推断出 T1 加权 MRI,进而利用 DPM 生成的 T1w-MRI 指导 PET 重建,表明 MRI 引导的 PET 图像在改善图像质量方面优于 OSEM。
- 通过扩散概率模型基于点和网格表示的联合特征自动牙齿排列
基于扩散概率模型,本研究提出了一种基于神经网络的牙齿排列方法,利用深度学习进行牙齿自动排列,通过提取牙模型的特征学习矫正牙齿的变换矩阵,生成具有满意的牙弓曲线和正常的咬合关系。
- DifFlow3D:基于扩散模型的稳健不确定性感知场景流估计
基于扩散概率模型的新型不确定性感知场景流估计网络 (DifFlow3D) 提出,具有卓越性能,在 FlyingThings3D 和 KITTI 2015 数据集上分别降低了 6.7%和 19.1%的 EPE3D,且在 KITTI 数据集上实 - EDiffSR: 一种高效的远程感知图像超分辨率扩展的扩散概率模型
本论文介绍了一种用于高效遥感图像超分辨率的扩散概率模型(DPM)EDiffSR,并结合了高效的激活网络(EANet)和条件先验增强模块(CPEM),以提高遥感图像的视觉质量和细节恢复能力。
- 扩散后照明技术用于模糊感知逆向渲染
逆向渲染是从图像中推断场景属性的挑战性逆向问题。我们提出了一种新颖的方案,将预训练于自然照明图上的降噪扩散概率模型与可微分路径追踪器相结合,允许从自然且能解释图像观察的光照和空间变化的表面材料组合中进行采样,以恢复材料并生成高度逼真和多样化 - UnDiff: 无监督语音恢复与无条件扩散模型
本文介绍了 UnDiff,一种扩散概率模型,能够解决各种语音反问题,并可以应用于条件不同的任务,如降级反演、神经声波编解码和语音来源分离等。首先,我们比较了不同的神经架构和预处理方法来解决无条件波形生成的难题,并通过最新的扩散模型后处理技术 - DiffBFR:基于自举的扩散模型的盲人脸修复
本文提出了一种基于扩散概率模型的盲目面部修复方法 DiffBFR,使用身份恢复模块和纹理增强模块实现了对低质量图像的身份还原和纹理细节增强,并通过截断采样保留了更多的原始细节。
- ICML长期节奏视频音轨器
该论文介绍了一个称为 LORIS 的新框架,用于在长期条件下生成可靠的波形,以生成与节奏视觉提示同步的音乐配乐,并扩展其模型的适用性,从舞蹈到多种体育场景,如地面练习和花样滑冰。
- CVPRVideoFusion:分解扩散模型用于高质量视频生成
本文提出了一种名为 VideoFusion 的方法,通过分解噪声来处理视频数据,并采用两个联合学习的网络来匹配噪声分解,提高了视频生成的质量,并且还证明了分解噪声公式可以受益于预训练的图像扩散模型和文本条件下的视频生成。
- 我们能否使用扩散概率模型进行三维运动预测?
本研究评估了扩散概率模型在 3D 人体运动预测任务中的潜力。通过对人类 3.6M 和 HumanEva-I 数据集的研究,我们发现扩散概率模型可以在单个(确定性)和多个(随机性)3D 运动预测任务中具有竞争力,并且可以在单个训练过程完成后达 - AAAI随机运动预测的人体关节运动扩散细化
该研究提出了一种名为 MotionDiff 的扩散概率模型,将人体运动的运动学视为受热的粒子,其自原始状态扩散到噪声分布。该方法通过一种自然的方式获取了 “白化” 的潜在变量,而无需任何可训练参数,证明 MotionDiff 模型在两种数据 - ICML利用扩散计划实现灵活的行为合成
本文通过扩展动力学模型,利用扩散概率模型去掉了传统轨迹优化方法的瓶颈,将采样和计划步骤近乎完全融合,通过分类器和图像插值获得了在线规划策略,并在长期决策和测试时间灵活性强的控制环境中成功应用了该框架。