用于工程设计优化的大型语言和文本到 3D 模型
近年来,文本到三维形状生成领域经历了大量的工作和兴趣。这篇综述报告了驱动文本到三维形状生成的底层技术和方法,并对需要的监督数据类型进行了系统分类。最后,讨论了现有方法的局限性,并勾画了未来工作的有希望的方向。
Mar, 2024
文献调查了最新的文本生成三维内容的方法,并详细介绍了该领域的背景、数据集、评估指标以及不同的三维表示方法。通过对生成流程的分类和优劣势的分析,为进一步探索基于文本的三维内容创建提供了启示,并指出了未来研究的几个有希望的方向。
May, 2024
工程设计优化需要高效结合三维形状表示、优化算法和设计性能评估方法,我们提出了一种在车辆设计场景中利用视觉语言模型来惩罚生成模型合成的不切实际汽车设计的快速演化设计优化 (PEDO) 框架。
Jun, 2024
本研究主要介绍了生成人工智能中的文本导向内容生成,着重探讨其中的文本导向三维技术,提供了一份关于该领域的综合调查报告。该报告介绍了三维数据表示、相关技术及其在不同应用方面的应用,包括头像生成、纹理生成、形状变换和场景生成,以及使用 NeRF 等文本到图像与三维建模技术的新兴方向的最新进展。
May, 2023
通过将生成式文本转图像模型和图像到 3D 方法相结合,如神经辐射场,文本到 3D 建模已经取得了令人兴奋的进展,但目前需要逐个优化来创建 3D 对象。我们提出了一种新的框架 - 摊销文本到 3D(ATT3D)- 通过以统一模型同时训练多个提示来摊销优化,从而在更短的时间内共享提示集的计算,实现了跨提示的知识共享,可以概括未见过的设置,并使文本之间的插值更加平滑,从而实现了新资产和简单动画的 3D 建模。
Jun, 2023
文中介绍了使用大型语言模型(LLMs)通过程序合成操作 3D 软件生成以文本驱动的三维形状的框架,旨在解决精确建模带有参数控制的具有锐利特征的几何图形的挑战,并强调了 LLMs 在工业应用的三维参数建模中的潜力和局限性。
Jan, 2024
本文提出一种新颖的文本生成 3D 模型方法(T2TD),通过引入相关形状或文本信息作为先验知识来提高 3D 模型生成模型的性能,并采用多层变压器结构逐步融合相关形状和文本信息,证明了该方法在 3D 模型生成质量上显着提高,且表现优于现有文本转形状数据集上的 SOTA 方法。
May, 2023
使用文本转图像模型作为视觉先验进行文本到 3D 合成,通过对参考图像进行文本反转来增强文本提示,提高文本到 3D 合成的多样性。
Dec, 2023
大规模文本到图像扩散模型的最新进展在文本到三维生成领域取得了重大突破,仅通过给定的文本提示从零开始创作三维内容。然而,现有的文本到三维技术在创作过程中缺乏一项关键能力:根据用户的需求规范(如草图)对合成的三维内容进行交互式控制和塑造。为了解决这个问题,我们首次尝试在条件上添加手绘草图的文本到三维生成,即 Control3D,以增强用户的可控性。具体而言,我们通过改进的 2D 条件扩散模型(ControlNet)来引导作为 NeRF 参数化的三维场景的学习,以使每个三维场景视角与给定的文本提示和手绘草图对齐。此外,我们利用预训练的可微分照片到草图模型直接估计合成三维场景上渲染图像的草图。此类估计的草图以及每个采样视角进一步被强制与给定的草图在几何上保持一致,从而实现了更好的可控文本到三维生成。通过广泛的实验证明,我们的提议可以生成与输入的文本提示和草图紧密对齐的准确忠实的三维场景。
Nov, 2023
通过使用大型预训练的文本到图像扩散模型生成的图像作为监督信号,我们提出了一种高效的文本到 3D 生成方法,在消费级显卡上仅需约 8 毫秒即可根据文本提示生成一个 3D 资产,并且不需要 3D 训练数据,通过提炼预训练图像扩散模型为高效文本到 3D 生成提供了一种替代方法。
Nov, 2023