本篇研究提出一种名为 NeuroSIM 的系统,使用基于领域特定语言 (DSL) 的符号程序将自然语言文本转化为图像操作,实现多模态空间的复杂推理,仅需要视觉问题回答(VQA)的标注数据即可。实验证明,该系统在图像操作方面表现出与已有的监督式数据基准相媲美或胜过的结果。
May, 2023
本文介绍了一种基于生成对抗网络的数据增强方法,可以有效地解决卷积神经网络在训练和测试数据之间存在领域差异时性能显著降低的问题。实验结果表明,该方法在领域自适应上表现出优异的性能。
Feb, 2020
本文提出了一种零样本图像操作的方法,通过参数网络生成关键转换参数,将任何引导信号转换为图像转换网络。实验证明,这种方法可以实现高质量的图像操作,并且同时处理不同形式的引导信号,例如风格图像和属性。
Mar, 2017
通过语义感知的计算机视觉技术,将艺术作品转化为照片般写实的图像,降低了艺术数据与真实数据的视觉差距,并取得了分类、检测和分割任务的表现优化。
Nov, 2018
提出的方法通过修改语义图像来灵活地生成和编辑图像,利用预先训练的图像到图像转换 GAN 进行改进,并展示了在图像伪造和图像编辑领域中的性能和应用,以及对抗深度学习图像取证技术的有效性和开发鲁棒且可推广的图像取证工具的紧迫需求。
Jan, 2024
本文主要探讨了基于场景图像进行图像编辑的问题,介绍了一种无需直接监督训练的空间 - 语义场景图网络,并通过实验验证了其能够实现在保留原始语义和风格的情况下生成新的图像构成和实现图像编辑。
Apr, 2020
提出利用语义布局来综合生成逼真图像的新方法,该方法建立了区域之间的依赖关系并通过动态加权网络实现,既保留了语义区分,同时加强了语义相关性,提高了全局结构和细节的合成质量。
Sep, 2021
本文提出了一种新概念,即通过手动制作像素标签或使用现有解决方案进行语义分割,将生成式架构与语义注释相结合,从而增强生成算法的内容感知性,提高生成的图像质量,避免常见的故障,并扩展这些算法的功能范围。
Mar, 2016
我们提出了一个新颖的多领域艺术品合成框架,通过语义布局生成艺术作品。我们还提出了一种名为 ArtSem 的数据集,包含 40,000 张不同领域的艺术品图像及其对应的语义标签地图。利用条件生成对抗网络(GAN),我们在不需要成对训练数据的情况下,从语义地图生成高质量的艺术品。我们的模型能够学习样式和语义信息的结合表示,从而提高生成艺术图像的质量。通过结合数据集和方法,我们能够生成用户可控的高质量艺术作品。
Aug, 2023
本论文讨论了如何在不需要训练样本的情况下学习图像的语义表示,并展示了如何从另一个领域学习并应用变换操作到目标领域实现图像检索。
Mar, 2019