Anything-3D: 面向野外的单视角任意物体重建

Apr, 2023

Anything-3D: 面向野外的单视角任意物体重建

Anything-3D: Towards Single-view Anything Reconstruction in the Wild

Qiuhong Shen, Xingyi Yang, Xinchao Wang

TL;DR本文提出了 Anything-3D 框架，采用了一系列视觉语言模型和 Segment-Anything 对象分割模型来实现从单个 RGB 图像到 3D 重建的任务，并通过实验验证了其有效性和可靠性。

Abstract

3d reconstruction from a single-rgb image in unconstrained real-world scenarios presents numerous challenges due to the inherent diversity and complexity of objects and environments. In this paper, we introduce A

3d reconstruction visual-language models object segmentation neural radiance field single-rgb image

发现论文，激发创造

使用 NeRFs 对 3D 中的任何物体进行分割

该研究提出了一个用于三维分割的新框架 SA3D，通过密度导向的反渲染将 2D 分割蒙版投影到 3D 蒙版网格，再通过迭代的方式学习准确的 3D 分割结果，实验表明 SA3D 在不同场景下的有效性。

Apr, 2023

Part123：从单视角图像进行部位感知的三维重建

Part123 是一种新颖的从单视图图像进行部分感知三维重建的框架，通过扩散模型生成多视角一致图像，并利用 Segment Anything Model (SAM) 生成多视角分割蒙版，然后通过对比学习将 2D 基于部分信息有效地结合到三维重建中，实验结果表明该方法可以在各种物体上生成具有高质量分割部分的三维模型，相较于现有无结构重建方法，该方法产生的部分感知三维模型对于特征保持重建、基本形状拟合和三维形状编辑等重要应用有益。

May, 2024

无需针对每个形状优化，45 秒内将任意单张图像转换为 3D 网格

该研究提出了一种新的方法，使用单个图像进行 3D 重建，生成了一个完整的 360 度 3D 纹理网格，改进于现有方法，具有更好的几何形状和一致性。

Jun, 2023

从单个图像中重建特定类别的物体

本文介绍了一种基于像素输入和 3D 刚性类别的输出的自动化流程，通过从现有物体检测数据集中学习可变形的 3D 模型并结合底层模块进行高频率形状细节恢复，实现了在单幅图像中获取真实场景下物体的三维表面重建，通过在最近引入的 PASCAL 3D + 数据集上的全面定量分析和消融研究展示了非常令人鼓舞的自动重建效果。

Nov, 2014

SAM3D: 三维场景中物体分割

SAM3D 是一个创新的框架，通过利用 RGB 图像中的 Segment-Anything 模型而无需进一步训练或微调，能够在 3D 点云中预测掩模，首先预测具有 SAM 的 RGB 图像的分割掩模，然后将 2D 掩模投影到 3D 点中。最后，两个相邻帧的点云掩模以双向合并的方式进行合并，最终可以将不同帧预测出的 3D 掩模逐渐合并为整个 3D 场景的 3D 掩模，实验结果表明 SAM3D 能够在不需要对 SAM 进行训练或微调的情况下，实现合理和细粒度的 3D 分割结果。

Jun, 2023

CAT3D: 利用多视角扩散模型创建三维任何物体

用于高质量 3D 捕捉的 CAT3D 方法模拟实际捕捉过程中的多视图扩散模型，通过给定任意数量的输入图像和一组目标新视点，生成高度一致的场景新视图，可用作强大的 3D 重建技术的输入，以实时渲染任意视点的 3D 表示。CAT3D 在短短一分钟内就可以创建完整的 3D 场景，并优于现有的单张图片和少视图 3D 场景创建方法。

May, 2024

SAM3D：基于 Segment Anything 模型的零样本三维物体检测

本研究旨在将基础模型的能力发挥在 3D 视觉任务中，在通过 SAM 提出的 BEV 流程管道构建的基础上，通过提高零样例能力实现 3D 物体检测，将其应用于 Waymo 开放数据集，展示其可行性。

Jun, 2023

开放词汇 SAM3D：理解任何三维场景

OV-SAM3D 是一个通用框架，用于不需要训练即可理解任何 3D 场景的开放词汇三维场景理解，通过使用 Segment Anything Model (SAM) 生成超点并通过 Recognize Anything Model (RAM) 的开放标签和操作表，结合超点和分割掩模生成最终的 3D 实例，经过对 ScanNet200 和 nuScenes 数据集的实证评估，我们的方法在未知的开放世界环境中超越了现有的开放词汇方法。

May, 2024

SAD：RGBD 分割

该研究通过提出 Segment Any RGBD（SAD）模型来解决 Segment Anything Model（SAM）对几何信息关注不足的问题，该模型将 SAM 与深度图像渲染相结合，同时包括了开放词汇的语义分割，实现了 3D 万象分割。

May, 2023

SAI3D：在 3D 场景中分割任意实例

SAI3D 是一种新颖的零样本三维实例分割方法，通过整合来自 Segment Anything Model (SAM) 的几何先验和语义线索，将三维场景划分为几何原语，然后逐步合并为与多视角 SAM 掩码一致的三维实例分割。通过具有动态阈值机制的分层区域增长算法，进一步提升细粒度三维场景解析的鲁棒性。在 Scan-Net 和更具挑战性的 ScanNet++ 数据集上进行的实证评估表明，我们的方法优于现有的开放词汇基准线，并在 ScanNet++ 上的类别不可知分割中甚至超过了全监督方法。

Dec, 2023