Open-DDVM: 光流估计的扩展与复制
DDFlow是一种基于数据净化的方法,可从未标注的数据中学习光流估计。该方法使用可靠的预测来指导学生网络学习光流,并能够为被遮挡像素进行光流估计,从而实现了更高的准确性。在Flying Chairs、MPI Sintel、KITTI 2012和2015基准测试中,DDFlow的性能显著优于所有现有的无监督学习方法,同时实现了实时运行。
Feb, 2019
使用Deep Equilibrium (DEQ)流估计器解决光流估计中存在的问题,包括计算和内存开销及模型不稳定,DEQ模型与循环神经网络模型相比运算更快,消耗更少训练内存,且结果更好,同时提出稀疏定点修正方案,测试结果表明在Sintel和KITTI数据集中有更好的计算和内存效率表现。
Apr, 2022
本综述主要介绍了最近视觉领域中扩散模型的进展,特别是那些影响扩散模型计算效率的重要设计方面,重点是强调了最近提出的设计选择,这些选择导致更高效的扩散模型。
Oct, 2022
本研究提出多个改进扩散ODE的最大似然估计技术,包括训练和评估技术,通过这些技术,我们无需变分去量化或数据增强在图像数据集上实现了具有最先进似然估计结果(CIFAR-10上的2.56,ImageNet-32上的3.43)。
May, 2023
本文展示了使用去噪扩散概率模型进行单目 depth 和 optical flow 估计,通过 Monte Carlo 推理,结合了自监督预训练和合成和真实数据的监督训练,能够在去噪和缺陷数据方面提供技术创新,以及对于不确定性和多模态的处理能力等方面都能取得最先进的效果。DDVM 是本文中提出的模型,相对深度误差为 0.074,比最佳发布方法的 Fl-all outlier rate 高 25%。
Jun, 2023
本文提出了一种名为DDM的扩散模型,通过将复杂的扩散过程分解为两个相对简单的过程,来提高生成效果和速度,它通过显式转移概率近似图像分布,并通过标准维纳过程控制噪声路径;文章还提出了一个新的DPM训练目标,能够分别预测噪声和图像成分,同时,DDM的逆向去噪公式可以自然地支持少数的生成步骤(不需要基于ODE的加速器),实验结果表明,DDM在更少的函数评估方面优于以前的DPM。
Jun, 2023
本研究介绍了一种高效有效的方法,MeDM,利用预训练的图像扩散模型进行视频到视频的翻译,保持一致的时间流。该提出的框架可以从场景位置信息(如常规G缓冲区)渲染视频,或对在真实场景中捕获的视频进行文本引导编辑。我们采用显式光流构建了一种实用编码方式,对生成的帧施加物理约束并调节独立的逐帧评分。通过利用这种编码,确保生成的视频在时间上保持一致可以被看作是一个具有闭合形式解的优化问题。为确保与稳定扩散的兼容性,我们还提出了一种方法修改潜在空间扩散模型中的观察空间评分。值得注意的是,MeDM不需要对扩散模型进行微调或测试时优化。通过对各种基准测试进行广泛的定性、定量和主观实验证明了该方法的有效性和优越性。
Aug, 2023