A3D:扩散是否也梦想着 3D 对齐?
本文提出了一种基于文本引导扩散模型的 3D 场景生成、编辑和新视角合成方法,并重点讨论了 3D 一致性、本地编辑和单张图像训练等基础问题,取得了较好的效果。
Nov, 2022
本文提出了一种使用基于文本转图像的扩散模型进行文本到 3D 合成的方法,该方法绕过了需要大规模标记的 3D 数据集和能够去噪的 3D 数据的限制,将 2D 的扩散模型作为先验,通过梯度下降优化 3D 模型(Neural Radiance Field),并使用概率密度蒸馏引入的损失函数将 2D 扩散模型与 3D 模型相结合。这种方法不需要 3D 训练数据,也不需要修改图像扩散模型,证明了使用预训练的图像扩散模型作为先验的有效性。
Sep, 2022
通过检索辅助的方法,RetDream 解决了文本到 3D 生成中存在的 3D 几何不一致问题,并实现了几何一致性和生成场景的忠实度的显著改进。
Feb, 2024
通过将 2D 扩散模型中的几何先验与定义良好的 3D 形状进行对齐,我们提高了一致性,解决了多视角不一致问题,并获得了新的最先进性能,85% 以上的一致性率,远高于以前的方法。
Oct, 2023
通过输入文本和风格参考图像,我们提出了一种生成风格化的三维对象的方法,利用神经辐射场重建来合成与文本提示一致内容和风格参考图像的三维模型,并通过样式化评分蒸馏损失来指导文本到三维的优化过程,输出视觉合理的几何和外观。经与现有方法的比较表明我们方法在视觉上表现强大,同时通过用户研究的定量结果得到进一步支持。
Jun, 2024
我们通过使用扩散先验来改进已有的文本生成 3D 模型的技术,提出了一种新的训练方法,并应用了深度监督和密度场正则化来提高几何表示和图像质量。实验结果表明我们的方法在提高真实感和多视角一致性方面优于现有技术。
May, 2023
本文研究基于 Text-to-Image 散射模型精调的神经放射场的 3D 建模问题。研究表明一些局限性的存在是方法本身优化和统一时间步骤采样之间的矛盾所造成的。提出通过使用单调非递增函数优先采样时间步长来解决这个矛盾,从而获得更高质量和多样性的 3D 模型。
Jun, 2023
通过将预训练的二维扩散模型引入神经光辐射场(NeRFs),文本到三维生成方法取得了巨大的进展,其中许多最先进的方法通常使用得分蒸馏采样(SDS)来优化 NeRF 表示,该方法通过预训练的文本条件的二维扩散模型(例如 ImData)监督 NeRF 优化。然而,由这种预训练扩散模型提供的监督信号仅依赖于文本提示,并不限制多视角一致性。为了将跨视角一致性引入扩散先验中,一些最近的工作通过多视角数据微调二维扩散模型,但仍缺乏细粒度的视图连贯性。为了解决这个挑战,我们将多视角图像条件纳入 NeRF 优化的监督信号中,明确强制执行细粒度的视图一致性。通过这种更强的监督,我们提出的文本到三维方法有效地减轻了由于过高密度而产生的浮动点和由于密度不足而形成的完全空白空间。我们在 T$^3$Bench 数据集上的定量评估表明,我们的方法在现有的文本到三维方法中达到了最先进的性能。我们将公开发布代码。
Dec, 2023
本文提出了 Dream3D 方法,将显式的三维形状先验引入 CLIP 导向的三维优化过程中,以生成高质量的三维形状。结合文本到图像扩散模型,Dream3D 能够生成精准而富有想象力的三维内容。
Dec, 2022
通过利用预训练的 T2I 扩散模型,借助预定时间步长安排,将文本到 3D 优化提升为多视角图像到图像转换问题,我们提出了一种新的优化算法和实用的三阶段粗到精的文本到 3D 优化框架 DreamFlow,实现快速生成高质量、高分辨率(1024x1024)的 3D 内容。
Mar, 2024