Gamba：将高斯点渲染与 Mamba 相结合用于单视角三维重建

Mar, 2024

Gamba：将高斯点渲染与 Mamba 相结合用于单视角三维重建

Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction

Qiuhong Shen, Xuanyu Yi, Zike Wu, Pan Zhou, Hanwang Zhang...

TL;DR我们通过使用大量的三维高斯模型实现了高效的三维资产重建，引入了一种基于序列网络的设计来进行上下文相关的推理和线性可伸缩处理，从而实现了优秀的生成能力和惊人的速度。

Abstract

We tackle the challenge of efficiently reconstructing a 3d asset from a single image with growing demands for automated 3d content creation pipelines. Previous methods primarily rely on Score Distillation Samplin

3d asset automated 3d content creation gamba 3d reconstruction 3d gaussians

发现论文，激发创造

MVGamba：将 3D 内容生成统一为状态空间序列建模

MVGamba 是一个通用而轻量级的高斯重建模型，通过基于 RNN 类似的状态空间模型 (SSM) 的多视角高斯重建器，来解决现有高斯重建模型中存在的多视角不一致和模糊纹理问题，并与多视图扩散模型集成，统一了从单一图像、稀疏图像或文本提示的 3D 生成任务，实验证明 MVGamba 在所有 3D 内容生成场景中优于现有基准模型，并且仅需要约 0.1 倍的模型大小。

Jun, 2024

AGG: 从单幅图像到三维的摄动生成三维高斯

给定增长需求的自动三维内容创建管道，研究了各种三维表示方法以从单个图像生成三维物体。提出了一种名为 AGG 的摊销生成三维高斯架构，可以从单个图像即时生成三维高斯物体，不再需要逐个实例的优化。通过利用中间混合表示，AGG 将生成三维高斯位置和其他外观属性进行联合优化。此外，提出了一个级联的流水线，先生成三维数据的粗略表示，然后使用三维高斯超分辨率模块进行上采样。通过与基于优化和基于采样的其它三维表示方法相比较，我们的方法在定性和定量上展示了具有竞争力的生成能力，同时速度提升了数个数量级。

Jan, 2024

GMSR：基于梯度引导的 RGB 图像谱重建方法

我们提出了一种名为 GMSR-Net 的轻量级模型，它通过全局接受域和线性计算复杂性特点，使用了多个堆叠的梯度 Mamba 块进行光谱重建，同时在空间和光谱提示上引入了新颖的梯度关注机制。与现有方法相比，GMSR-Net 大幅减少了参数和计算负担，同时实现了最新的性能。

May, 2024

DGMamba: 通过广义状态空间模型实现域泛化

该研究提出了一种名为 DGMamba 的新型域泛化框架，具有对未知领域的强大普适性和全局感受野以及高效的线性复杂度，通过引入 HSS 和 SPR 两个核心组件来改进分布偏移问题；其中，HSS 减少了与特定领域特征相关的隐藏状态对输出预测的影响，而 SPR 旨在通过重新排列图像内的非语义补丁，并通过领域之间的补丁融合来规范化 Mamba。在四个常用的域泛化基准测试中进行的广泛实验证明，DGMamba 相比于现有模型取得了卓越的结果。

Apr, 2024

利用蒙特卡洛任意掩蔽法提高医学图像重建的全局敏感度和不确定性量化

提出了一种使用 MambaMIR 和 MambaMIR-GAN 进行医学图像重建和不确定性估计的方法，通过 Arbitrary-Masked Mamba-based 模型和波尔塔斯转换结合，实现了最佳的重建保真度和感知质量。

May, 2024

GaussianObject: 只需四张图像，使用高斯喷洒获得高质量三维物体

从稀疏视图中重建和渲染 3D 物体是促进 3D 视觉技术应用和提高用户体验的关键。本文提出了 GaussianObject 框架，通过高斯散射达到高质量渲染，仅需 4 张输入图像，解决了构建多视角一致性和补充遗漏物体信息的困难，同时在多个数据集上显示出卓越的重建效果，超越现有方法。

Feb, 2024

MambaMIR：一种用于联合医学图像重建和不确定性估计的任意屏蔽的 Mamba

本研究介绍了 MambaMIR 模型及其基于生成对抗网络的变体 MambaMIR-GAN，利用 Mamba 模型的优势，如线性复杂度、全局感受野和动态权重，通过创新的任意掩码机制使 Mamba 适应图像重建任务，并提供蒙特卡洛法的不确定性估计。实验证明 MambaMIR 和 MambaMIR-GAN 在多个医学图像重建任务中（包括快速 MRI 和 SVCT）取得了与当今最先进方法相媲美甚至更好的重建结果，并提供可靠性的重建质量的估计不确定性图。

Feb, 2024

三视图遇上高斯点云投影：使用 Transformer 快速且可推广的单视图 3D 重建

通过前向推理，我们介绍了一种从单张图像高效生成三维模型的新方法，利用基于 Transformer 的网络，即点解码器和三面解码器，通过混合的 Triplane-Gaussian 中间表示重建三维物体，从而在渲染速度和渲染质量上实现了平衡，并比之前的技术在质量和运行时间方面取得了更好的效果。

Dec, 2023

DreamGaussian：高效三维内容生成的生成高斯点图方法

最近在 3D 内容创建方面的最新进展主要利用基于优化的 3D 生成通过得分蒸馏抽样（SDS）。尽管取得了有希望的结果，但这些方法往往受到每个样本优化速度慢的限制，限制了它们的实际应用。本文提出了 DreamGaussian，一个同时实现效率和质量的创新性 3D 内容生成框架。我们的关键见解是在 UV 空间中设计了一个具有伴随网格提取和纹理细化功能的生成性 3D 高斯飞溅模型。与神经辐射场中使用的占位修剪不同，我们证明了 3D 高斯曲线的渐进致密化对于 3D 生成任务的收敛速度更快。为了进一步提高纹理质量并促进下游应用，我们引入了一种将 3D 高斯曲线转换为纹理网格的高效算法，并应用了一个微调阶段来细化细节。大量实验证明了我们提出方法的卓越效率和竞争的生成质量。值得注意的是，DreamGaussian 从单视图图像中仅用 2 分钟即可生成高质量的纹理网格，与现有方法相比加速了大约 10 倍。

Sep, 2023

喷溅图像：超快速单视角 3D 重建

我们介绍了 Splatter Image，这是一种超快的单目三维物体重建方法，运行速度达到每秒 38 帧。Splatter Image 基于高斯颗粒化技术，该技术近期实现了实时渲染、快速训练和出色的多视角重建扩展性。我们首次将高斯颗粒化应用于单目重建领域。我们的方法基于学习，测试时只需要前馈评估一个神经网络即可完成重建。Splatter Image 的主要创新之处在于其设计意外地简单：它使用一个二维图像到图像的网络将输入图像映射到每个像素点上的一个三维高斯。因此，所得到的高斯形式呈现为一张图像，即 Splatter Image。我们进一步扩展了该方法，使用多个图像作为输入，并通过添加交叉视图注意力来实现。由于渲染器的速度（每秒 588 帧），我们可以在训练时只使用一个 GPU，在每次迭代中生成整个图像，以优化 LPIPS 等感知度量标准。在标准基准测试中，我们不仅展示了快速重建，而且在 PSNR、LPIPS 和其他度量标准方面相比最近和更昂贵的基线方法取得了更好的结果。

Dec, 2023