滚动扩散模型
本文提出了一种自回归、端到端优化的视频扩散模型,受到神经视频压缩技术的启发,可用于生成高质量的视频,并提出了可扩展的连续排名概率得分(CRPS)方法,以评估视频的概率预测能力,该方法在自然和仿真视频的多个数据集上比先前方法的感知质量和概率预测有着显著的提高。
Mar, 2022
我们提出了一种将渐进扩散概念(沿着扩散时间轴操作)扩展到运动序列的方法,用于支持时变去噪,从而将两个轴相互纠缠,通过迭代去噪逐渐增加噪声位移的动作缓冲区,并产生任意长的帧流,为长期运动合成提供了新的框架。
Jul, 2023
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
本文介绍了一种新型的基于热扩散(或模糊)的生成建模扩散过程,它可以等效地通过具有非等向噪声的高斯扩 散过程来定义模糊,这一过程构成了一个推断性热反馈与去噪扩散之间的桥梁。最后,我们提出了一个广义的扩散模型类,它结 合了标准的高斯去噪扩散和推断热反馈的优点,称之为模糊扩散模型。
Sep, 2022
通过利用扩散概率模型和随机扩散(StochDiff)模型,本研究提出了一种新型方法,学习每个时间步长的数据先验知识,从而更好地对高度随机化的时间序列进行建模,通过实验验证了该方法在随机时间序列预测中的有效性,并展示了在实际医疗指导中的应用潜力。
Jun, 2024
扩散模型通过训练大量数据点,利用逐渐添加随机噪声和逆扩散过程将数据样本从复杂分布转换为简单分布,并学习数据流形,优于其他方法(包括生成对抗网络)来建模自然图像等分布。
Dec, 2023
通过扩散技术和设计的补丁注意力模块,我们提出了 RS-Diffusion - 第一个基于扩散模型的单帧滚动快门(RS)校正方法。我们还提出了 RS-Real 数据集,其中包括被 RS 坏像帧以及通过相应的惯性测量单元(IMU)陀螺仪数据校正成的 GS(Global Shutter)基准图像对。实验证明,我们的 RS-Diffusion 超过了之前的单帧 RS 校正方法。我们的方法和提出的 RS-Real 数据集为推进 RS 校正领域奠定了坚实的基础。
Jul, 2024
本文提出了一种基于 non-autoregressive diffusion model 的时间序列预测模型 TimeDiff,通过引入 future mixup 和 autoregressive initialization 两种新的条件机制,实现了高质量的时间序列预测,并在实验中展现了超过现有模型的表现。
Jun, 2023