多样化的语义图像编辑与风格编码
本文提出了一种样式保留的调制方法,利用两个调制的过程表示上下文样式和语义布局,该方法可以注入给定的语义布局同时保留图像特定的上下文风格,并设计了渐进式结构来生成重新编辑内容,可以明显减轻生成区域与已知像素之间的不连续边界问题。
Jul, 2022
我们提出了一种弱监督方法,实现复杂场景下的有条件图像生成,在该方法中,用户可以对场景中出现的对象进行精细控制。我们利用稀疏语义地图来控制对象的形状和类别,以及文本描述或属性来控制局部和全局风格,同时引入语义注意力模块来支持文本描述的条件,该模块的计算成本与图像分辨率无关。为了进一步增强场景的可控性,我们提出了一个两步生成方案来分解背景和前景。我们使用大词汇目标检测器产生的标签地图来训练模型,这使我们能够访问未注释的数据,并提供结构化实例信息。在这样的设置下,我们报告了比全监督设置更好的 FID 得分。我们还展示了我们的模型在 COCO 和 Visual Genome 等复杂数据集上操作场景的能力。
Dec, 2019
本文介绍了一种基于 StyleGAN 的语义编辑方法,可以局部移植另一张图像的特征,而不需要额外的监督或复杂的操作,实现了对 GAN 图像的语义编辑,并提高了图像的真实感。
Apr, 2020
SESAME 是一种基于生成器鉴别器对的语义编辑方法,利用独立处理图像和语义的输入流向来操作或添入特定语义概念,实现场景的快速编辑和图像生成。
Apr, 2020
我们提出了一种推理时间编辑优化方法,旨在通过两个专门的损失函数,成功地完成本地图像修改和全局内容一致性保留的竞争子任务,实现文本、姿势和涂鸦等多种编辑指令类型的灵活编辑解决方案,并通过定性和定量实验证明了我们能够实现复杂的编辑。
Nov, 2023
本文提出了一种基于变分自编码器的类别和层次的扩展方法,能够通过学习多个潜在空间在本地和全局水平上灵活地控制每个对象类别以处理确定对象样式的各种因素,生成的图像在真实数据集、合成数据集三个不同领域的广泛实验中都表现出更加合理、更具多样性的特点,可用于图像合成和编辑任务。
Jun, 2021
提出的方法通过修改语义图像来灵活地生成和编辑图像,利用预先训练的图像到图像转换 GAN 进行改进,并展示了在图像伪造和图像编辑领域中的性能和应用,以及对抗深度学习图像取证技术的有效性和开发鲁棒且可推广的图像取证工具的紧迫需求。
Jan, 2024