Art2Real：通过语义感知的图像翻译展示艺术品的真实面貌

CVPRNov, 2018

Art2Real：通过语义感知的图像翻译展示艺术品的真实面貌

Art2Real: Unfolding the Reality of Artworks via Semantically-Aware Image-to-Image Translation

Matteo Tomei, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara

TL;DR通过语义感知的计算机视觉技术，将艺术作品转化为照片般写实的图像，降低了艺术数据与真实数据的视觉差距，并取得了分类、检测和分割任务的表现优化。

Abstract

The applicability of computer vision to real paintings and artworks has been rarely investigated, even though a vast heritage would greatly benefit from techniques which can understand and process data from the artistic domain. This is partially due to the small amount of annotated

computer vision artistic data photo-realistic visualizations semantic understanding domain shift

发现论文，激发创造

如何阅读绘画：多模态检索的语义艺术理解

该研究提出了 SemArt，一个多模态数据集，以进行语义艺术理解，包括将视觉和文本表现编码成共同的语义空间，以及 Text2Art 挑战，即通过艺术文本检索相关艺术品。在测试样本中，最佳方法可以在前 10 个排名的图像中找到正确的图像率达 45.5％。

Oct, 2018

可控多领域语义艺术创作

我们提出了一个新颖的多领域艺术品合成框架，通过语义布局生成艺术作品。我们还提出了一种名为 ArtSem 的数据集，包含 40,000 张不同领域的艺术品图像及其对应的语义标签地图。利用条件生成对抗网络（GAN），我们在不需要成对训练数据的情况下，从语义地图生成高质量的艺术品。我们的模型能够学习样式和语义信息的结合表示，从而提高生成艺术图像的质量。通过结合数据集和方法，我们能够生成用户可控的高质量艺术作品。

Aug, 2023

SemI2I：面向遥感数据域自适应的语义一致图像翻译

本文介绍了一种基于生成对抗网络的数据增强方法，可以有效地解决卷积神经网络在训练和测试数据之间存在领域差异时性能显著降低的问题。实验结果表明，该方法在领域自适应上表现出优异的性能。

Feb, 2020

学习操控艺术图像

本文提出了一种基于任意风格图像操作网络（SIM-Net）的方法，该方法利用无语义信息作为指导并采用自我监督策略中的区域传输策略进行图像生成。定性和定量实验证明了我们的方法相较于现有方法的优越性。

Jan, 2024

揭示空间：从室内空间图像中获取具有建筑意义的语义描述

该研究论文旨在通过提出的模型从二维场景中提取具有建筑意义的语义描述，通过训练合成生成的图像以及相应的高级建筑结构，使用像素级比较评估，在真实环境中对其性能进行测试和评估。

Dec, 2023

语义风格转换：将草图变为艺术品

本文提出了一种新概念，即通过手动制作像素标签或使用现有解决方案进行语义分割，将生成式架构与语义注释相结合，从而增强生成算法的内容感知性，提高生成的图像质量，避免常见的故障，并扩展这些算法的功能范围。

Mar, 2016

语义绘图工程用于文本到图像的生成

通过生成对抗网络（GAN）或变压器模型进行文本到图像生成。提出了一种方法，利用人工智能模型进行主题创造，并对实际绘画过程进行分类建模。通过将所有视觉元素转化为可量化的数据结构来创建图像，并与现有的图像生成算法进行语义准确性、图像可复现性和计算效率方面的有效性评估。

Dec, 2023

语义感知 Mask CycleGAN：将艺术人像转化为照片般逼真的可视化呈现

本文提出了 Semantic-aware Mask CycleGAN（SMCycleGAN）架构，可以将艺术画像翻译成照片现实视觉效果，该模型可以生成逼真的人类肖像，并通过向鉴别器馈送语义掩码的伪样本来强制其做出有用决策，以便对发电机进行优化以合成更逼真的人类肖像而不是将其他无关组件的相似度增加到最大。

Jun, 2023

用文字描绘

本研究探讨零样本语义图像绘画的问题。我们提出了一种新的方法，利用实际的文字描述，在合成图像中添加新的语义概念，通过结合最先进的逼真图像生成模型和文本 - 图像语义相似度网络，使用非梯度方法探索潜在空间，通过放松 GAN 的计算来针对特定区域的变化并进行用户研究进行比较。

Mar, 2021

基于扩散的图像标注及检索在文化遗产中的应用

通过生成式视觉 - 语言模型来增强艺术品数据集，以应对文化遗产领域中有限的注释数据和领域偏移，提高模型对艺术特征的理解和生成恰当术语的能力。

Aug, 2023