- 一个图像到三维生成的扩散时间步骤课程
通过对扩散时间步骤进行区分处理,提出了 Diffusion Time-step Curriculum one-image-to-3D(DTC123)的一种单图到三维管道,以实现 score distillation sampling(SDS - CVPRIPoD: 使用点扩散进行隐含场学习,从单个 RGB-D 图像进行可推广的三维物体重建
通过结合隐式场学习和点扩散,IPoD 方法在 3D 对象重建方面取得了优越性能,对动态适应目标对象形状以及提高精细细节刻画能力起到了积极作用。在 CO3D-v2 和 MVImgNet 数据集上的实验结果验证了 IPoD 方法在 F 分数和 - MVDiffusion++:密集高分辨率多视图扩散模型用于单视或稀疏视角的三维对象重建
本研究提出了一种名为 MVDiffusion++ 的神经架构,用于 3D 物体重建,通过一张或几张图像生成物体的密集高分辨率视图。MVDiffusion++ 采用了两个令人惊讶地简单的想法,即 “无姿态架构”,其中 2D 潜在特征之间的标准 - iFusion:从稀疏视角倒置扩散进行无姿态重建
iFusion 是一个新颖的 3D 物体重建框架,只需两个未知相机姿态的视图。通过使用预训练的新视图合成扩散模型进行相机姿态估计和新视图合成,iFusion 能够在 3D 物体重建中表现出良好的性能并与其他方法相融合。
- AAAI手中单目 RGB 视频的三维物体重建
本文提出一种新方法,通过引入 2D 遮挡澄清和物理接触约束,从而处理遮挡下的表面重建问题,该方法在测试集上表现优于现有方法,HO3D 效果提高了 52%,HOD 效果提高了 20%。
- DreamComposer: 可控的多视角条件下的 3D 物体生成
利用预训练的 2D 大规模生成模型,我们提出了 DreamComposer,一个可灵活可扩展的框架,通过注入多视图条件来增强现有的视图感知扩散模型,以生成具有高保真度的具有多视图条件的新视图图像,并用于可控的 3D 物体重建和其他各种应用。
- PF-LRM:用于联合姿态和形状预测的无姿态大型重建模型
我们提出了一种无姿势大重建模型(PF-LRM),可以从少数非姿势图像中重建三维物体,即使视觉重叠很少,同时在单个 A100 GPU 上估计相对相机姿势,仅需约 1.3 秒。PF-LRM 是一种高度可扩展的方法,利用自注意力块在三维物体标记和 - 基于结构的训练对三维定位精度和质量的影响
本研究介绍了一种基于结构的训练方法,用于单分子定位显微镜(SMLM)和三维物体重建的基于卷积神经网络(CNN)的算法。通过与传统的基于随机的训练方法相比较,利用 LUENN 软件包作为我们的人工智能管道,定量评估表明结构化训练方法在检测率和 - ICCVSimNP:学习神经点之间的自相似先验
利用类别层次的自相似性连接神经点辐射场和神经点,通过学习四维对象重建方法,SimNP 能在提供语义对应的同时重建无法观测到的对称未见的对象区域,优于以往的方法。
- 基于物体中心射线采样的稀疏三维重建
我们提出了一种从由 360 度校准相机组拍摄的一组稀疏视图中重建 3D 物体的新方法。我们通过混合模型,使用基于 MLP 的神经表示和三角形网格,表示对象表面。我们工作的一个关键贡献是一种新颖的以对象为中心的神经表示采样方案,其中的光线在所 - 一种一站式的 3D 目标重建和多级分割方法
一个开源的一站式三维目标重建和多层分割框架(OSTRA)实现了在 2D 图像上的分割,通过分割标签在图像序列中跟踪多个实例,然后使用多视角立体摄影(MVS)或基于 RGBD 的三维重建方法进行标签化的三维物体或多个部分的重建。
- ICCV基于空间变换器的单视角三维重建中的隐性学习
利用 LIST 神经网络架构,借助局部和全局图像特征,精确地从单张图像中重建 3D 物体的几何和拓扑结构,既可以预测目标物体的粗糙形状,又能通过隐式预测器准确地预测任意点与目标表面之间的有向距离,模型在重建合成和真实世界图像中的 3D 物体 - 多视角 3D 物体重建和不确定性建模与神经形状先验
通过神经对象表示学习对象形状分布并将其映射到潜在空间,我们利用不确定性感知编码器直接从单个输入图像生成具有不确定性的潜在代码以模拟 3D 物体重建领域中的不确定性,并在贝叶斯框架下提出增量融合方法来融合多视角观测的潜在编码,从而提高 3D - NAVI: 无类别偏见图像集合与高质量的三维形状和姿态标记
提出了 NAVI 数据集,包括高质量 3D 扫描的对象的类别无关图像集和每个图像的 2D-3D 对齐,旨在促进基于随意图像采集的 3D 重建和对应估计的系统性研究进展。
- CVPRMobileBrick:在移动设备上构建三维重建的乐高
通过利用具备已知几何形状的乐高模型,在手机采集的高分辨率 RGB 图像和低分辨率深度图的基础上,得到了 153 个 3D 对象模型的高精度 3D 真实形状,该多视角 RGBD 数据集可在 3D 重建领域提供独特机会,对多种 3D 重建算法进 - 使用视觉 Transformer 进行高效的 3D 物体重建
使用视觉 transformer 替代卷积在现有的高效,高性能的 3D 目标重建技术中,预测三维结构并取得类似或优于基线方法的准确度,表明视觉 transformer 在三维目标重建任务中有着巨大的潜力。
- 关键点预测下的目标姿态自监督学习
本文提出了一种基于自监督学习的关键点预测方法来进行相机位姿预测及三维目标物体的在线重建的深度学习网络,并在几个数据集上进行了实验,取得了显著的改进。
- 基于无人机毫米波雷达的多目标三维重建
本研究探讨了利用安装在无人机上的毫米波雷达传感器对多个物体在空间中重建 3D 形状的可行性,并评估了两个不同的模型,结果表明这两个模型在解决多个物体重建问题方面都很有前途。
- ECCV结构因果三维重建
本文研究从野外单视图图像中无监督地重建 3D 物体的问题。与现有的方法不同,我们通过隐式正则化来限制潜在空间的结构,以捕捉潜在因素的拓扑因果排序(即将因果依赖关系表示为有向无环图),并根据任务依赖性寻找因果因子排序的多种方法。实验表明,潜在 - ECCV通过神经反渲染实现自校准光度立体成像
本文旨在解决在未知物体形状、物体反射率和光照方向的情况下进行三维物体重建的任务,提出了一种新的利用神经反演渲染和渐进式反射率基础来解决未标定光度测量问题的方法。该方法在真实世界数据集上表现出最先进的精度。