用于工程设计优化的大型语言和文本到 3D 模型

Jul, 2023

用于工程设计优化的大型语言和文本到 3D 模型

Large Language and Text-to-3D Models for Engineering Design Optimization

Thiago Rios, Stefan Menzel, Bernhard Sendhoff

TL;DR本文研究了在工程领域中，利用深度文本到 3D 模型的潜力，将其与计算模拟设计优化中的三维资产相结合，探讨了由于自然语言的不同解释而导致优化框架的挑战，并在航空动力学优化中，成功地利用 Shap-E 和两种不同的表示文本提示的方法，实现自动进化设计优化框架的构建，研究结果表明需要确保生成的设计在应用领域的对象类别内，并需要进一步研究如何提高文本提示变化强度和 3D 设计变化的因果关系。

Abstract

The current advances in generative ai for learning large neural network models with the capability to produce essays, images, music and even 3D assets from text prompts create opportunities for a manifold of disciplines. In the present paper, we study the potential of →

generative ai deep text-to-3d models computational simulation-based design optimization shap-e evolutionary design optimization

发现论文，激发创造

文本到 3D 形状生成

近年来，文本到三维形状生成领域经历了大量的工作和兴趣。这篇综述报告了驱动文本到三维形状生成的底层技术和方法，并对需要的监督数据类型进行了系统分类。最后，讨论了现有方法的局限性，并勾画了未来工作的有希望的方向。

Mar, 2024

野外文本生成三维内容调查

文献调查了最新的文本生成三维内容的方法，并详细介绍了该领域的背景、数据集、评估指标以及不同的三维表示方法。通过对生成流程的分类和优劣势的分析，为进一步探索基于文本的三维内容创建提供了启示，并指出了未来研究的几个有希望的方向。

May, 2024

基于生成式 AI 的提示演化工程设计优化与视觉语言模型

工程设计优化需要高效结合三维形状表示、优化算法和设计性能评估方法，我们提出了一种在车辆设计场景中利用视觉语言模型来惩罚生成模型合成的不切实际汽车设计的快速演化设计优化 (PEDO) 框架。

Jun, 2024

生成型人工智能遇上 3D：AIGC 时代的文本到 3D 调查

本研究主要介绍了生成人工智能中的文本导向内容生成，着重探讨其中的文本导向三维技术，提供了一份关于该领域的综合调查报告。该报告介绍了三维数据表示、相关技术及其在不同应用方面的应用，包括头像生成、纹理生成、形状变换和场景生成，以及使用 NeRF 等文本到图像与三维建模技术的新兴方向的最新进展。

May, 2023

ATT3D: 文本生成三维物体的摊薄

通过将生成式文本转图像模型和图像到 3D 方法相结合，如神经辐射场，文本到 3D 建模已经取得了令人兴奋的进展，但目前需要逐个优化来创建 3D 对象。我们提出了一种新的框架 - 摊销文本到 3D（ATT3D）- 通过以统一模型同时训练多个提示来摊销优化，从而在更短的时间内共享提示集的计算，实现了跨提示的知识共享，可以概括未见过的设置，并使文本之间的插值更加平滑，从而实现了新资产和简单动画的 3D 建模。

Jun, 2023

3D-PreMise: 大型语言模型能否生成具备清晰特征和参数控制的三维形状？

文中介绍了使用大型语言模型（LLMs）通过程序合成操作 3D 软件生成以文本驱动的三维形状的框架，旨在解决精确建模带有参数控制的具有锐利特征的几何图形的挑战，并强调了 LLMs 在工业应用的三维参数建模中的潜力和局限性。

Jan, 2024

基于先验知识引导的文本 - 三维生成模型

本文提出一种新颖的文本生成 3D 模型方法（T2TD），通过引入相关形状或文本信息作为先验知识来提高 3D 模型生成模型的性能，并采用多层变压器结构逐步融合相关形状和文本信息，证明了该方法在 3D 模型生成质量上显着提高，且表现优于现有文本转形状数据集上的 SOTA 方法。

May, 2023

DiverseDream: 借助增强的文本嵌入进行多样化的文本到三维合成

使用文本转图像模型作为视觉先验进行文本到 3D 合成，通过对参考图像进行文本反转来增强文本提示，提高文本到 3D 合成的多样性。

Dec, 2023

Control3D：面向可控的文本到 3D 生成

大规模文本到图像扩散模型的最新进展在文本到三维生成领域取得了重大突破，仅通过给定的文本提示从零开始创作三维内容。然而，现有的文本到三维技术在创作过程中缺乏一项关键能力：根据用户的需求规范（如草图）对合成的三维内容进行交互式控制和塑造。为了解决这个问题，我们首次尝试在条件上添加手绘草图的文本到三维生成，即 Control3D，以增强用户的可控性。具体而言，我们通过改进的 2D 条件扩散模型（ControlNet）来引导作为 NeRF 参数化的三维场景的学习，以使每个三维场景视角与给定的文本提示和手绘草图对齐。此外，我们利用预训练的可微分照片到草图模型直接估计合成三维场景上渲染图像的草图。此类估计的草图以及每个采样视角进一步被强制与给定的草图在几何上保持一致，从而实现了更好的可控文本到三维生成。通过广泛的实验证明，我们的提议可以生成与输入的文本提示和草图紧密对齐的准确忠实的三维场景。

Nov, 2023

ET3D：通过多视角蒸馏实现高效的文本到三维生成

通过使用大型预训练的文本到图像扩散模型生成的图像作为监督信号，我们提出了一种高效的文本到 3D 生成方法，在消费级显卡上仅需约 8 毫秒即可根据文本提示生成一个 3D 资产，并且不需要 3D 训练数据，通过提炼预训练图像扩散模型为高效文本到 3D 生成提供了一种替代方法。

Nov, 2023