深度图像融合
该论文介绍了一种利用前景和背景图片的上下文和颜色信息进行端到端优化并采用自学习策略来训练的,能够自动生成高质量图像合成的新方法,该方法基于拉普拉斯金字塔融合,提出了一种密集的多流融合网络,并在易于复杂的情况下进行渐进式训练,其在定性和定量上均优于现有方法。
Nov, 2020
本文提出了一种高分辨率图像融合的解决方案 ——Gaussian-Poisson 生成对抗网络(GP-GAN),旨在优化传统梯度方法和生成对抗网络的优势,采用高斯泊松方程来表征高分辨率图像融合问题,并提出了一个混合 GAN,学习了复合图像与良好混合图像之间的映射。实验证明该方法获得了最高性能。
Mar, 2017
该论文提出了一种用于图像融合的端到端深度卷积神经网络,通过收集大规模高质量的训练数据,能够更好地捕捉复合图像的背景和前景的上下文和语义信息,实验表明,所提出的网络优于以往的方法。
Feb, 2017
图像合成的目标是将前景对象与背景图像合并以获取逼真的合成图像。最近,基于大型预训练扩散模型的生成式合成方法由于其前所未有的图像生成能力而得到发展。然而,生成的结果往往会丢失前景细节并出现明显的伪影。在本文中,我们提出了一种名为 DreamCom 的尴尬简单方法,灵感来自 DreamBooth。具体来说,给定一个主题的几个参考图像,我们通过微调文本导向修复扩散模型来将该主题与特殊标记相关联,并在指定的边界框内修复该主题。我们还构建了一个专门为此任务设计的新数据集 MureCom。
Sep, 2023
本文提出使用深度学习模型、上下文相关机制和对抗训练方案等技术进行宽范围图像融合,达到在两个不同的输入照片之间生成中间区域的新图像内容,以及在保持融合时的空间和语义一致性的同时,提高生成全景图像的视觉质量。
Mar, 2021
本论文提出了 PrimeComposer,一种快速训练无关的扩散器,通过在不同噪声水平上精心设计的注意力引导来组合图像。该方法主要通过使用我们的关联扩散器,在每个步骤上利用其自注意层来实现。我们的方法在前景生成、合成质量和推理效率方面都表现出卓越的优势。
Mar, 2024
通过使用大规模预训练的扩散模型,我们提出了一种可控的图像合成方法,将图像混合、图像协调、视角综合和生成式合成统一为一个扩散模型,同时设计了一个自监督训练框架和一个定制化的训练数据准备方法,并通过局部增强模块提高合成图像中前景细节的保真性。我们的方法在公共基准和实际数据上进行了评估,结果表明我们的方法比现有方法能够生成更加忠实和可控的合成图像。
Aug, 2023
该论文提出一种新型的图像混合方法,基于 GAN 反演原理,利用一个 better latent 空间,通过新的 GAN 嵌入算法与通用分割掩模配合使用,借助它将多个参考图像的视觉特性融合成一张逼真、更有连贯性、更具有细节保留能力的图像。
Jun, 2021
本研究介绍了一种利用语义对象检测和分割以及相应的遮罩生成在图像融合过程中自动融合图像的方法,并且引入了 PAN 的使用来进一步提高质量。与许多经典的视觉融合模型相比,我们的方法在 PSNR,SSIM 和真实性等各种性能指标方面表现出色。此外,该过程高效且速度快,适用于工业环境中。这个新的过程有潜力革新视觉内容创作并提高各个行业的生产率。
Jun, 2023
该论文提出了一种现代化的密集图像对齐算法 —— 反向组合算法,通过结合数据驱动的先验知识,采用一种鲁棒的方式优化了来自多个元件的算法,并在多个 3D 刚性运动估计任务中取得了较好的表现。
Dec, 2018