Atlas3D: 适用于模拟和制造的受物理约束的自支撑文本到 3D 转换

May, 2024

Atlas3D: 适用于模拟和制造的受物理约束的自支撑文本到 3D 转换

Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication

Yunuo Chen, Tianyi Xie, Zeshun Zong, Xuan Li, Feng Gao...

TL;DR通过使用 Atlas3D 方法，可以生成满足用户设计意图、在交互游戏、具身化 AI 和机器人领域中可靠互动所需的、在物理上稳定的自支撑 3D 模型。

Abstract

Existing diffusion-based text-to-3d generation methods primarily focus on producing visually realistic shapes and appearances, often neglecting the physical constraints necessary for →

diffusion-based text-to-3d generation methods physical constraints balance downstream tasks self-supporting 3d models

发现论文，激发创造

Guide3D：根据文本和图像指导创建 3D 化身

通过结合文字和图像信息，利用扩散模型，我们开发了一种零样本的三维生成模型，能够合成高分辨率纹理网格，实现了将二维图像直接转化为三维空间的功能。

Aug, 2023

一种基于得分蒸馏采样的文本到 3D 的定量评估

通过定量评估指标、交叉验证人类评级以及分析 SDS 技术的失败案例，我们提出了一种新的计算效率基准模型，以解决生成模型中的艺术问题，包括 3D 模型准确性和文本提示之间的错位问题，并在所提出的评估指标上达到了最先进的性能。

Feb, 2024

精确物理驱动的文本到 3D 生成

Phy3DGen 是一种精确的、驱动物理的文本生成 3D 方法，通过分析生成的 3D 形状的固体力学，揭示了现有文本生成 3D 方法生成的 3D 形状在真实世界应用中不符合物理定律的问题，并利用 3D 扩散模型和一个数据驱动的可微分物理层来优化 3D 形状先验，同时实现几何的高效优化和学习 3D 形状的精确物理信息，实验结果表明我们的方法能够兼顾几何的合理性和精确的物理感知，进一步连接 3D 虚拟建模和精确的物理世界。

Mar, 2024

Consistent3D: 通过确定性采样先验实现一致高保真度的文本到 3D 生成

通过分析分数蒸馏抽样（SDS）及其变体，我们发现其蒸馏抽样过程实际上对应于随机微分方程（SDE）的轨迹抽样，这启发我们提出了一种新颖有效的 “Consistent3D” 方法，该方法通过确定性抽样先验来进行文本到三维生成。实验结果表明，Consistent3D 在生成高保真度和多样性的三维物体和大规模场景方面具有很高的效能。

Jan, 2024

EucliDreamer: 快速而高质量的稳定扩散深度三维模型纹理化

本文采用一种新方法，通过给定文本提示和 3D 网格来生成 3D 模型的纹理。该方法考虑了额外的深度信息，利用深度条件稳定扩散的评分蒸馏采样过程生成纹理。我们在开源数据集 Objaverse 上运行了模型，并进行了用户研究，与各种 3D 纹理方法的结果进行了比较。我们证明了我们的模型可以生成更令人满意的结果，并为同一对象产生各种艺术风格。此外，在生成可比质量的纹理时，我们取得了更快的时间。我们还进行了彻底的消融研究，研究了不同因素对生成质量的影响，包括采样步骤、引导尺度、负提示、数据增强、高度范围和替代 SDS 方法。

Nov, 2023

VividDreamer：朝向高保真高效的文本到 3D 生成

提出了一种基于姿态相关性蒸馏采样（PCDS）的扩散式三维生成任务的新目标，其通过最小采样步骤（1-3）建立了在扩散轨迹内的姿态相关性函数，以近似真实梯度，并通过粗到细的优化策略实现高质量的三维物体生成。

Jun, 2024

ATT3D: 文本生成三维物体的摊薄

通过将生成式文本转图像模型和图像到 3D 方法相结合，如神经辐射场，文本到 3D 建模已经取得了令人兴奋的进展，但目前需要逐个优化来创建 3D 对象。我们提出了一种新的框架 - 摊销文本到 3D（ATT3D）- 通过以统一模型同时训练多个提示来摊销优化，从而在更短的时间内共享提示集的计算，实现了跨提示的知识共享，可以概括未见过的设置，并使文本之间的插值更加平滑，从而实现了新资产和简单动画的 3D 建模。

Jun, 2023

MatAtlas: 文本驱动的一致性几何纹理和材质分配

我们提出了 MatAtlas，一种用于一致的文本引导的 3D 模型纹理方法。通过利用大规模的文本生成模型（例如稳定的扩散器）作为纹理 3D 模型的先验知识。我们设计了一种 RGB 纹理流程，利用了基于深度和边缘的网格模式扩散。通过提出多步骤的纹理细化过程，我们显著提高了纹理输出的质量和 3D 一致性。为了进一步解决烘焙光照的问题，我们超越了 RGB 颜色，将参数化材质分配给资源。鉴于高质量的初始 RGB 纹理，我们提出了一种利用大语言模型（LLM）的新颖材质检索方法，实现了可编辑性和重光能力。我们在各种几何形状上评估了我们的方法，并展示了我们的方法明显优于先前的方法。通过详细的消融研究，我们还分析了每个组件的作用。

Apr, 2024

使用分类器分数蒸馏的文本到 3D 转换

通过对分类器无关指导在分数蒸馏中的作用进行重新评估，我们发现了一个令人惊讶的发现：仅仅用指导就足够进行有效的文本到 3D 生成任务。我们称之为分类器分数蒸馏（CSD）方法，它可以理解为使用隐式分类模型进行生成。这种新视角揭示了对现有技术的新见解。我们在形状生成、纹理合成和形状编辑等各种文本到 3D 任务中验证了 CSD 的有效性，取得了优于现有方法的结果。

Oct, 2023

高效文本引导的三维感知人像生成：应用得分蒸馏采样于分布

本研究提出了一种名为 DreamPortrait 的算法，它可以在一个前向传递中生成文本引导下的 3D 感知画像，通过 Score Distillation Sampling 和 GAN 损失正则化方法来优化分布，进一步设计了 3D 感知门控交叉关注机制，生成高效且具有鲁棒的多视图语义一致性的人像。

Jun, 2023