StyleCity: 基于视觉和文本参考的渐进优化大规模 3D 城市场景风格化

Apr, 2024

StyleCity: 基于视觉和文本参考的渐进优化大规模 3D 城市场景风格化

StyleCity: Large-Scale 3D Urban Scenes Stylization with Vision-and-Text Reference via Progressive Optimization

Yingshu Chen, Huajian Huang, Tuan-Anh Vu, Ka Chun Shum, Sai-Kit Yeung

TL;DR通过图像和文本作为参考，StyleCity 能够以语义意识的方式对大规模城市场景的三维纹理网格进行风格化，并生成谐和的全方位天空背景。通过将 2D 视觉和文本先验转移到 3D 全局和局部，StyleCity 逐步缩放输入 3D 场景的计划训练视图以保留高质量场景内容，并通过调整样式图像的比例和训练视图的比例来全局优化场景风格。此外，通过语义感知的样式损失提高局部语义一致性，并采用生成扩散模型合成样式一致的全方位天空图像，从而提供更沉浸式的氛围，并助力语义风格化过程。实验结果表明，我们的风格化场景在定性和定量性能以及用户偏好方面表现出卓越性能。

Abstract

Creating large-scale virtual urban scenes with variant styles is inherently challenging. To facilitate prototypes of virtual production and bypass the need for complex materials and lighting setups, we introduce the first →

large-scale virtual urban scenes vision-and-text-driven texture stylization stylecity neural texture field omnidirectional sky background

发现论文，激发创造

城市建筑师：带有布局先验的可操控的三维城市场景生成

通过引入一种组合式 3D 布局表示方法到文本转 3D 范式中的本文，克服了在大规模城市范围内扩展这一方法的局限性，并且成功地将文本转 3D 技术应用于覆盖超过 1000m 行驶距离的大尺度城市场景，同时展示了可调控城市场景生成的强大能力。

Apr, 2024

3D 照片风格化：从单张图像学习生成风格化新视角

本文提出了一个深度模型，在场景的点云表示中学习基于几何感知的内容特征，以生成高质量且在视图上具有一致性的艺术化图像，从而实现了从单个图像到任意风格化图像的 3D 照片艺术化生成，并在定性和定量研究中展示了方法的优越性。

Nov, 2021

Dream-in-Style: 使用风格化得分蒸馏的文本到 3D 生成

通过输入文本和风格参考图像，我们提出了一种生成风格化的三维对象的方法，利用神经辐射场重建来合成与文本提示一致内容和风格参考图像的三维模型，并通过样式化评分蒸馏损失来指导文本到三维的优化过程，输出视觉合理的几何和外观。经与现有方法的比较表明我们方法在视觉上表现强大，同时通过用户研究的定量结果得到进一步支持。

Jun, 2024

学习新视角的风格化

本文提出一种基于点云的方法，通过反投影图像特征到 3D 空间、点云聚合模块获取 3D 场景的风格信息并用线性转换矩阵对点云特征进行变换、将变换后的特征投影到 2D 空间获得新视角来生成具有一致风格的 3D 场景，实验证明该方法相比其他方法生成的配景画面更加一致和美观。

May, 2021

场景条件下的三维物体风格化与组合

通过结合建模和优化对象的纹理和环境光照，本论文提出了一个框架，使得现有的 3D 资源能够适应给定的 2D 场景，同时生成一种真实感的组合效果，使得假定的对象能够放入该环境中。

Dec, 2023

3DStyleGLIP：面向部分的文本引导的 3D 神经风格化

介绍了一种基于文本驱动的、部分定制的 3D 风格化的新方法 3DStyleGLIP，该方法利用 Grounded Language-Image Pre-training (GLIP) 模型的视觉 - 语言嵌入空间来定位 3D 模型的各个部分，并按照文本提示中指定的风格修改它们的颜色和局部几何形状，通过在 GLIP 的嵌入空间中使用部分级风格损失和两种补充学习技术，有效地训练了 3DStyleGLIP，实验证实了该方法在部分级别的风格化任务上取得了显著成果，显示出推动 3D 风格化领域发展的潜力。

Apr, 2024

Text2Scene：基于文本的室内场景风格化与局部细节

通过引用图像和文本描述，我们提出了一种名为 Text2Scene 的方法，可以自动创建由多个物体组成的虚拟场景的逼真纹理，这种方法在房间的标记三维几何体上增加了详细纹理，使生成的颜色尊重经常由类似材料组成的分层结构或语义部分。

Aug, 2023

HyperStyle3D: 通过超网络进行文本引导的 3D 人像风格化

本文提出了一种基于 3D-aware GANs 的 HyperStyle3D 方法，利用 CLIP 模型作为样式指导，可以在不要求 3D 数据的情况下进行立体画风化处理，实验结果表明该方法在不同的画风、形状变形、属性修改等方面展现了优异表现，且保持了 3D 一致性。

Apr, 2023

StyleMesh：室内三维场景重建的风格转换

本研究基于场景重建的网格应用风格转移技术，让用户能够在虚拟现实中欣赏以喜欢的艺术家绘画风格来呈现的三维环境。研究通过对场景网格的纹理进行优化并从所有可用的输入图像上共同进行风格化，实现了一致性和稳定性风格化表现。

Dec, 2021

InfiniCity: 无限规模城市合成

本文提出了一种名为 InfiniCity 的新颖框架，该框架利用 2D 和 3D 数据分为三个可行的模块，可以构建和渲染出具有任意规模和可穿行性的 3D 城市环境，并允许用户进行灵活交互式编辑。

Jan, 2023