Mar, 2024

可控的文本到三维生成:面对齐的高斯扩散

TL;DR本研究主要关注在控制性文本生成 3D 场景方面的多视图控制网络架构,该网络结合额外的输入条件,如边缘、深度、法线和素描图,使用局部和全局嵌入来控制基础扩散模型,并通过优化实现 3D 生成,最终实现了高质量、可控的 3D 内容的生成。