- 多模态条件下的三维人脸几何生成
我们提出了一种新的方法,用于多模态条件下的三维人脸几何生成,可以通过多种不同的条件信号实现对输出身份和表情的用户友好控制。该方法基于扩散过程,在一个二维参数化的 UV 领域中生成三维几何形状,并通过交叉注意层 (IP-Adapter) 将每 - 具有二次状态成本的 Schrödinger 桥精确可解
本研究提出了 Schrödinger 桥的正则化变体,该桥具有二次状态成本,鼓励最优样本路径与名义水平保持接近。我们导出了这个马尔可夫核的闭式解,该解恢复了传统 Schrödinger 桥的解,并且与量子力学中某些确切可解模型有关联。
- 基于得分的生成模型与自适应动量
通过引入适应性动量采样,有效加速了转换过程,同时在小样本步骤中产生更加逼真的图像 / 图表,并在图像和图表生成任务中获得了有竞争力的评分。
- SubGDiff:一种改善分子表示学习的子图扩散模型
本文介绍了一种新颖的分子表示学习方法,通过将分子子图信息纳入扩散过程中,提升了分子表示学习的效果。实验结果表明,该方法在下游任务中具有更好的性能表现。
- 仅需采样一次:通过自协同扩散生成对抗网络驯化单步文本到图像合成
YOSO 是一种新颖的生成模型,通过将扩散过程与 GANs 集成,实现快速、可扩展和高保真度的一步图像合成。我们展示了 YOSO 作为一步生成模型在从头开始的训练中具有竞争性能,并且可以扩展到通过 LoRA 微调高质量的一步文本到图像合成。 - MM等离子体共振模型:非完全信息博弈下,通过孤立子解研究使用第三方干预分析假新闻扩散模型的重复困境条件
通过使用非线性偏微分方程表征表面等离子共振现象,该研究提出了一种模拟假新闻传播过程的新方法,在特定的社交群体或通信网络中迅速放大假新闻传播,并通过孤子解法研究其动态。此外,考虑先手、次手和第三手策略在这个非线性系统中的相互作用,对假新闻传播 - 通过视觉分析解释生成扩散模型以实现可解释的决策过程
通过可视化分析和实验结果,我们提出并回答三个研究问题,从可视概念和模型关注的区域的角度解释扩散过程,展示了在扩散过程中输出如何逐渐生成,通过不同时间步骤中的噪声去除程度和与基础可视概念之间的关系强调了可视概念的变化水平,从而为了解扩散机制提 - 光与最优薛定谔桥匹配
用最优 Schrödinger 桥匹配方法学习,借鉴能量建模目标,实现了与任意传输计划输入的单个桥匹配步骤下的 Schrödinger 桥过程的可靠恢复。
- NODI: 带有扩散噪声的离群检测
采用扩散过程将提供整个训练集的信息纳入预测的噪声向量中,并推导出噪声向量的闭合解,将噪声向量转化为用于度量 OOD 的得分。通过在 OOD 基准测试上对比深度模型预测的噪声向量和闭合解噪声向量的表现,我们的方法在所有类型的图像编码器中胜过以 - 提示硬或几乎不提示:用于文本到图像扩散模型的 Prompt 反转
通过使生成的图像内容与用户意图一致的提示,该方法利用扩散模型进行串行优化得到直观的语言提示,从而产生具有相似内容的多样化图像。
- AAAI图上的广义神经扩散框架
提出了一个带有准确性项的一般扩散方程框架,从而形式化地建立了扩散过程与更多图卷积网络之间的关系,并通过实验证明了高阶邻居标签之间的相似性特征,推动了新型图扩散网络(HiD-Net)的设计。
- PCRDiffusion:基于扩散的点云配准概率模型
我们提出了一个新的框架,将点云配准问题看作是从噪声变换到对象变换的去噪扩散过程,并通过生成模型和统一概率表达解决了代表性的判别任务之一 - 点云配准问题。
- 在黎曼流形上等变传递神经网络的几何洞察
该研究论文提出了在黎曼流形上进行等变消息传递的几何视角,利用坐标无关的特征场表示黎曼流形上的数值特征,并通过优化特征空间的度量来最优地保留主丛的原始度量,从而得到与向量丛相关的等变扩散过程,进而提出了一种新的等变图神经网络框架,推广了 AC - OmniControl:人体动作生成的任意时间控制
OmniControl 通过扩展传播过程,将灵活的空间控制信号融入文本条件下的人体运动生成模型中,并引入了分析空间引导和现实引导来提高控制精度和运动逼真性。
- 纯净演示中的模仿学习
基于扩散过程的两步纯化方法,通过引入噪声消除了不完美展示中的潜在扰动,并从扩散后的数据中恢复出最优的专家展示,评估结果表明方法的有效性.
- EDMP:预算引导扩散的运动规划集成
我们提出了 EDMP,即基于代价引导的扩散运动规划集合,旨在结合经典规划与基于深度学习的运动规划的优势,通过在多样的有效运动轨迹集合上进行训练的扩散网络,计算特定场景的代价,如 “碰撞代价”,并引导扩散生成满足场景约束条件的有效轨迹,同时使 - 高度欠采样磁共振图像重建的相关多频扩散建模
通过结合 k - 空间数据和扩散过程的特性,本研究提出了一种新的方案,利用不同策略挖掘多频先验,并保留重建图像中细节纹理,同时通过高频先验提取器更快地收敛扩散过程,从而提高了 MRI 重建的准确性和采样过程的加速性。实验结果验证了该方法成功 - 使用随机游走的稀疏近似进行网络嵌入
提出一种基于交通时间的网络嵌入的高效数值实现,使用扩散小波算法得到的网络上的扩散过程的稀疏逼近。通过随机梯度下降法,并对绿函数的低维表示进行采样,计算节点嵌入,并通过多个示例展示了该方法在数据聚类和多标签分类方面的有效性,并比较了其在效率和 - 具有明确转移概率的解耦扩散模型
本文提出了一种名为 DDM 的扩散模型,通过将复杂的扩散过程分解为两个相对简单的过程,来提高生成效果和速度,它通过显式转移概率近似图像分布,并通过标准维纳过程控制噪声路径;文章还提出了一个新的 DPM 训练目标,能够分别预测噪声和图像成分, - 半隐式去噪扩散模型(SIDDM)
通过匹配隐式和显式因素,我们提出了一种新的方法,以解决生成模型中的采样难题,该方法利用隐式模型匹配噪声数据的边缘分布和前向扩散的显式条件分布,以有效地匹配联合降噪分布,并获得与扩散模型相当的生成性能和比采样步骤少的模型相比更好的结果。