多样化的语义图像编辑与风格编码

Sep, 2023

多样化的语义图像编辑与风格编码

Diverse Semantic Image Editing with Style Codes

Hakan Sivuk, Aysegul Dundar

TL;DR本研究提出了一个框架，能够以一种新的机制对可见和部分可见的对象进行编码，以实现样式编码和最终生成之间的一致性。通过与以前的条件图像生成和语义图像编辑算法进行广泛比较，我们的实验表明，我们的方法在技术上显著改进。我们的方法不仅在定量结果上取得了更好的成果，而且提供了多样化的结果。

Abstract

semantic image editing requires inpainting pixels following a semantic map. It is a challenging task since this →

semantic image editing inpainting semantic map style encoding conditional image generation

发现论文，激发创造

深度生成模型在语义图像修复中的应用

本文提出了一种基于生成模型的新型语义图像修复方法，该方法可在缺失的内容相互独立的情况下进行推理，并取得超越其他方法的像素级真实感。

Jul, 2016

具有保留风格调节的上下文一致的语义图像编辑

本文提出了一种样式保留的调制方法，利用两个调制的过程表示上下文样式和语义布局，该方法可以注入给定的语义布局同时保留图像特定的上下文风格，并设计了渐进式结构来生成重新编辑内容，可以明显减轻生成区域与已知像素之间的不连续边界问题。

Jul, 2022

弱监督图像生成中的风格和语义控制

我们提出了一种弱监督方法，实现复杂场景下的有条件图像生成，在该方法中，用户可以对场景中出现的对象进行精细控制。我们利用稀疏语义地图来控制对象的形状和类别，以及文本描述或属性来控制局部和全局风格，同时引入语义注意力模块来支持文本描述的条件，该模块的计算成本与图像分辨率无关。为了进一步增强场景的可控性，我们提出了一个两步生成方案来分解背景和前景。我们使用大词汇目标检测器产生的标签地图来训练模型，这使我们能够访问未注释的数据，并提供结构化实例信息。在这样的设置下，我们报告了比全监督设置更好的 FID 得分。我们还展示了我们的模型在 COCO 和 Visual Genome 等复杂数据集上操作场景的能力。

Dec, 2019

编辑风格：揭示 GAN 的本地语义

本文介绍了一种基于 StyleGAN 的语义编辑方法，可以局部移植另一张图像的特征，而不需要额外的监督或复杂的操作，实现了对 GAN 图像的语义编辑，并提高了图像的真实感。

Apr, 2020

SESAME: 通过添加、操作或删除对象来语义编辑场景

SESAME 是一种基于生成器鉴别器对的语义编辑方法，利用独立处理图像和语义的输入流向来操作或添入特定语义概念，实现场景的快速编辑和图像生成。

Apr, 2020

基于优化的多模态语义图像编辑

我们提出了一种推理时间编辑优化方法，旨在通过两个专门的损失函数，成功地完成本地图像修改和全局内容一致性保留的竞争子任务，实现文本、姿势和涂鸦等多种编辑指令类型的灵活编辑解决方案，并通过定性和定量实验证明了我们能够实现复杂的编辑。

Nov, 2023

基于类别和层次的 VAEs 实现多样化语义图像合成和编辑

本文提出了一种基于变分自编码器的类别和层次的扩展方法，能够通过学习多个潜在空间在本地和全局水平上灵活地控制每个对象类别以处理确定对象样式的各种因素，生成的图像在真实数据集、合成数据集三个不同领域的广泛实验中都表现出更加合理、更具多样性的特点，可用于图像合成和编辑任务。

Jun, 2021

像素化的语义着色

使用卷积神经网络、自回归模型以及像素化对象语义来引导图像上色，结果在 PASCAL VOC2012 和 COCO-stuff 上表现更好。

Jan, 2019

CIMGEN：有限数据下基于预训练生成模型的受控图像操纵

提出的方法通过修改语义图像来灵活地生成和编辑图像，利用预先训练的图像到图像转换 GAN 进行改进，并展示了在图像伪造和图像编辑领域中的性能和应用，以及对抗深度学习图像取证技术的有效性和开发鲁棒且可推广的图像取证工具的紧迫需求。

Jan, 2024

通过 SegVAE 进行可控图像合成

SegVAE 是一个基于变分自编码器的条件图像生成网络，快速合成逼真的语义地图，为各种图像处理、编辑应用提供了良好的基础。

Jul, 2020