- 检测时生成式增强用于医学图像分割
本文提出了一种新颖的方法来增强测试时间内的医学图像分割,通过将生成模型整合到测试时间扩充中,可以有效地生成给定测试样本的多个视图,从而提高分割结果的可靠性。
- 随机占据核方法用于系统识别
使用占位核方法从数据中非参数地学习常微分方程,提出了一种两步法来学习随机微分方程的漂移和扩散,第一步使用占位核算法学习漂移,第二步使用半定规划学习扩散,以核的平方关联的 RKHS 中学习扩散的平方作为非负函数。
- 以光速学习扩散
JKOnet * 是一个简单的模型,能够学习扩散过程的漂流、潜力、相互作用和内部能量组成,通过简单的二次损失最小化,表现出更强的表示能力,优于其他基准模型。
- 扩散高斯混合音频降噪
提出了一种 DiffGMM 模型,它是基于扩散和高斯混合模型的去噪模型。通过反向过程估计高斯混合模型的参数,从而近似真实噪声分布,并通过连续减去估计的噪声来输出清晰的音频信号。广泛的实验结果表明,所提出的 DiffGMM 模型达到了最先进的 - 基于随机演示的学习:使用重要性采样扩散模型的离线强化学习
我们提出了一种新的离线强化学习方法,利用引导扩散世界模型来直接评估离线目标策略,并进行一种重要性抽样的世界模型更新来使其与更新后的策略适应。在 D4RL 环境中的评估结果显示,在只有随机或中等专家示范的情况下,我们的方法相较于现有基线表现显 - MatFusion:一种用于 SVBRDF 捕获的生成扩散模型
我们将从照片中估计 SVBRDF 作为一项扩散任务,并使用一种新颖的无条件 SVBRDF 扩散基础模型 MatFusion 对分布具有空间变化的材料进行建模,然后通过条件扩散模型细化该基础模型以估计照片中的材料特性,并展示了我们的方法在不同 - D-Flow: 通过流控制分化生成
通过与流动匹配模型(Flow-Matching models)不再训练特定任务模型,我们引入 D-Flow,这是一个简单的框架,通过在流动过程中进行微分来控制生成过程,并优化源(噪声)点。我们验证了该框架在线性和非线性控制生成问题上的有效性 - DiffusionNOCS:管理 Sim2Real 多模式类别层面姿态估计中的对称性和不确定性
通过引入概率模型和扩散方法,该研究提出了一种能够解决类别级别姿态估计问题的方法,并通过测试在真实数据集上展示了该方法的有效性和出色的泛化能力。
- 低剂量 CT 图像去噪的泊松流一致性模型
提出了一种结合了 Poisson 流一致性模型(PFCM)的后采样 Poisson 流一致性模型(PS-PFCM)的图像去噪技术,该方法能够在低剂量 CT 图像上优于当前的最优扩散样式模型,并在 CIFAR-10 数据集上提供了初步结果。
- 自然图像抠图的扩散
利用扩散方法来解决图像抠像任务,在本论文中,我们提出了 DiffMatte,一种解决方案,旨在有效地克服计算负担和训练与推断过程中噪声采样不一致等挑战。
- DiffCAD: 基于弱监督的概率 CAD 模型检索和对齐
基于 CAD 模型基元从 RGB 图像中感知 3D 结构可以有效地实现基于三维物体的场景表示,本文提出了 DiffCAD,这是一种第一个弱监督的条件生成方法,可以从 RGB 图像中检索和对齐 CAD 模型,通过扩散学习隐式概率模型来捕捉 C - PINF:用于物理约束深度学习的连续归一化流
本文介绍了基于物理信息的归一化流(PINF),它是连续归一化流的一种新方法,通过特征方法结合扩散,能高效解决高维时间依赖和稳态福克 - 普朗克方程。
- 基于分数偏移的分子构象生成
分子构象生成的新方法通过将分子的反积分过程视作对由分子所组成的原子施加逐渐增加的力场,从而使原子间距的变化分布从高斯分布向麦克斯韦 - 玻尔兹曼分布转变,该生成模型保证了可行的原子间距几何,并且具有时间可逆性。实验结果表明,该方法相比最先进 - 任意尺寸扩散:面向高清图像的任意尺寸文本驱动合成的高效实现
提出了一种名为 Any-Size-Diffusion (ASD) 的两阶段流程,用于通过优化文本条件扩散模型和引入快速无缝平铺扩散 (FSTD) 技术来有效生成任意尺寸的图片,并在 LAION-COCO 和 MM-CelebA-HQ 基准测 - XFlow:基于图的流行为基准测试
我们提出了一种新颖的基准套件,涵盖了各类任务、基准模型、图形数据集和评估工具,并提供了一个广义方法来处理不同域中与流相关的任务,作为蓝图和路线图。
- QDC:图上的量子扩散卷积核
该研究提出了一种名为量子扩散卷积(QDC)算子的新卷积核,该算子通过基于顶点之间的占据相关性交换的泛化扩散范例,对图进行有效地重连。此外,该研究还引入了一种多尺度变种,将 QDC 算子和传统组合型拉普拉斯算子的信息相结合。通过对谱相关性和量 - 自动解码潜在的三维扩散模型
本文提出了一种新颖的生成静态和关节 3D 资产的方法,其中核心是一个 3D 自解码器框架,将目标数据集中学习到的属性嵌入潜在空间,然后通过解码来渲染具有一致性的外观和几何体积表示;在不需要摄像头信息的情况下,通过学习来进行更加高效的训练,实 - KDD从单个快照重构图形扩散历史
研究了一种困难的扩散历史记录问题,提出了一种新的重建方法 —— 基于后验分布的重建方法,通过 Metropolis-Hastings Markov 链蒙特卡洛方法和无监督图神经网络来加速 M-H MCMC 的收敛,实验结果表明该方法有效。
- 联合结构和扩散 MRI 进行丘脑核的领域不可知分割
该研究提出了一种使用卷积神经网络(CNN)从任意分辨率的 T1 和扩散数据中区分丘脑核的方法,该方法基于一种公共组织学图谱和高质量扩散数据的银标准分割工具,并可应用于不同来源的数据集。
- DiffTAD: 带有提案去噪扩散的时间动作检测
本文提出了一种使用扩散去噪的新时域动作检测(TAD)方法,名为 DiffTAD。该方法采用生成建模方法,而非以往判别式学习方法,借助 Transformer decoder 中引入的时间位置查询设计来建立去噪过程,通过交叉步选择性调节算法来