DiffuMatting: 利用抠图级别的注释合成任意对象

Mar, 2024

DiffuMatting: 利用抠图级别的注释合成任意对象

DiffuMatting: Synthesizing Arbitrary Objects with Matting-level Annotation

Xiaobin Hu, Xu Peng, Donghao Luo, Xiaozhong Ji, Jinlong Peng...

TL;DR通过引入 DiffuMatting 算法和基于绿屏的颜色控制，实现了高准确度的标注生成、社区友好的艺术设计和可控的生成，从而使得 DiffuMatting 成为一种综合导向的绿屏抠图工具。

Abstract

Due to the difficulty and labor-consuming nature of getting highly accurate or matting annotations, there only exists a limited amount of highly accurate labels available to the public. To tackle this challenge, we propose a →

diffumatting annotations green-screen-matting matting-data generator controllable generation

发现论文，激发创造

自然图像抠图的扩散

利用扩散方法来解决图像抠像任务，在本论文中，我们提出了 DiffMatte，一种解决方案，旨在有效地克服计算负担和训练与推断过程中噪声采样不一致等挑战。

Dec, 2023

DiffusionMat：Alpha Matting 作为顺序精化学习

本文介绍了一种名为 DiffusionMat 的新型图像抠像框架，它采用扩散模型从粗糙到精细的透明度图过渡。通过将噪声添加到阈值图并使用预训练的扩散模型迭代去噪，我们的方法将图像抠像视为一种顺序细化学习过程，并通过校正模块确保最终输出与输入图像的结构一致。此外，我们引入了 Alpha 可靠性传播技术，该技术通过选择性增强自信透明度信息的阈值区域来简化校正任务。通过使用专门针对透明度图边缘准确性和不透明与透明区域一致性的损失函数训练校正模块，我们评估了我们的模型，并结果表明 DiffusionMat 始终优于现有方法。

Nov, 2023

在任何场景中生成任何物体

我们提出了一种简单高效的数据增强训练策略，通过插入适配器层来引导扩散模型仅专注于对象身份，使得我们的模型具备控制每个生成个性化对象的位置和大小的能力，并提出了区域引导抽样技术来保持生成图像的质量和保真度。

Jun, 2023

MatFusion：一种用于 SVBRDF 捕获的生成扩散模型

我们将从照片中估计 SVBRDF 作为一项扩散任务，并使用一种新颖的无条件 SVBRDF 扩散基础模型 MatFusion 对分布具有空间变化的材料进行建模，然后通过条件扩散模型细化该基础模型以估计照片中的材料特性，并展示了我们的方法在不同类型的入射光照条件下对单张照片的精度能够达到或超过现有的 SVBRDF 估计方法。

Apr, 2024

DetDiffusion：将生成模型和感知模型协同工作以提升数据生成和感知能力

当前的感知模型依赖于资源密集型的数据集，因此需要创新性的解决方案。通过利用扩散模型和合成数据，通过从各种注释中构建图像输入，有助于下游任务。DetDiffusion 首次统一了生成模型和感知模型，解决了为感知模型生成有效数据的挑战。为了增强感知模型的图像生成能力，我们引入了感知感知损失（P.A. 损失），通过分割改善图像的质量和可控性。为了提高特定感知模型的性能，我们的方法在生成过程中提取和利用感知感知属性（P.A. 属性）进行自定义数据增强。目标检测任务的实验结果突出了 DetDiffusion 卓越的性能，在布局引导生成方面建立了新的最先进技术水平。此外，DetDiffusion 生成的图像合成能够有效增强训练数据，显著提高下游检测性能。

Mar, 2024

MatFuse: 控制能力的扩散模型材料生成

MatFuse 是一种基于扩散模型的新型统一方法，用于简化计算机图形学中高质量逼真材料的创建，通过集成多种条件来源实现细粒度控制和材料合成的灵活性，该方法展示出与最先进方法相当的性能，同时丰富了创作可能性。

Aug, 2023

交互式自然图像抠图：使用 Segment Anything 模型进行任意图层抠取

MatAny 是一种新的互动自然图像抠图模型，通过基于轮廓和透明度预测来自动生成伪 trimap，有效降低了对大规模抠图应用的人力需求，是目前性能最好、支持互动方式最多的交互式抠图算法。

Jun, 2023

GeoDiffuser：基于几何的扩散模型图像编辑

GeoDiffuser 是一种优化为基础的方法，将常见的二维和三维基于图像的对象编辑功能统一为单一方法，通过将图像编辑操作视为几何变换，并将其直接合并到扩散模型的注意力层中隐式执行编辑操作，以实现保持对象风格并生成合理图像的目标函数进行训练 - free 优化方法。

Apr, 2024

LayoutDiffusion：可控的布局到图像生成扩散模型

本文提出了一种名为 LayoutDiffusion 的扩散模型，通过构建结构图像块来解决布局与图像的多模态融合的难点，并利用 Object-aware Cross Attention 实现相对精确的分区和位置敏感的空间信息控制，实现比现有方法更高的生成质量和更高的可控性。

Mar, 2023

CamDiff: 基于扩散模型的伪装图像增强技术

该论文提出了一种基于 AI-Generated Content 的 CamDiff 方法，利用 latent diffusion model 综合伪装场景中的显著物体来生成更具有代表性的伪装样本，其结果表明，该方法能够吸引用户的关注并对现有的 COD 模型提出更大的挑战。

Apr, 2023