- 对选定的 NeRF 特征进行高效可扩展定位的查询图像匹配
MatLoc-NeRF 是一种使用选定的 NeRF 特征的基于匹配的定位框架,以提高效率和准确度,通过采用可学习的特征选择机制来消除对所有 NeRF 特征或附加描述符的需求,并利用姿态感知场景分区策略和场景分割器提供快速的粗略初始姿态估计。 - 基于法向引导的高保真三维曲面重建的神经隐式函数
通过使用一阶微分特性 (即,表面法线),本文展示了训练神经表示形成高准确度的 3D 表面重建,即使只有两个 RGB 视图可用,极大地改善了以前难以捕捉的复杂几何细节和薄结构。
- NeB-SLAM: 基于神经块的可扩展 RGB-D SLAM 未知场景
提出了一种用于未知场景的神经分块可伸缩 RGB-D SLAM 方法 NeB-SLAM,通过将整个未知场景表示为一组固定大小的神经分块子图,并采用自适应的地图增长策略在摄像机跟踪过程中逐渐覆盖整个未知场景,对各种数据集进行广泛评估,证明了该方 - 基于神经有向距离场的结构光系统深度重建
我们介绍了一种新颖的基于神经隐式表示法的多帧结构光设置深度估计技术。通过自我监督的可微分渲染训练神经符号距离场(SDF)。与被动视觉不同,我们利用结构光系统中通过投影模式已知的辐射场,实现几何场的独立优化,确保固定设备定位下的收敛性和网络有 - S3-SLAM: 稀疏三面体编码用于神经隐式 SLAM
通过稀疏的三平面编码和分层捆绑调整,我们提出了一种能够在高分辨率上实现快速而高质量跟踪和建图的方法,该方法仅使用了常用三平面参数的 2~4% 的存储空间。
- PhyRecon: 物理合理神经场景重建
该论文介绍了使用可微渲染和可微物理模拟相结合的方法来学习隐式表面表示,并通过改进的算法实现了隐式表示和显式表面点之间的有效转化,从而在物理要求高的领域中获得更加真实和准确的重建结果。
- DeepMIF:大规模 LiDAR 3D 地图的深度单调隐式场
通过使用 LiDAR 传感器进行 3D 环境感知,本文提出了一种基于神经隐式表示和可优化特征网格的学习方法,通过优化非度量单调隐式场,实现了高质量的密集 3D 建图。
- Vox-Fusion++:基于体素的神经隐式密集跟踪与多地图建图
介绍了 Vox-Fusion++,一个利用神经隐式表示和传统体积融合技术进行多地图鲁棒稠密跟踪和建图的系统,并应用于实际场景,通过综合评估表明在重建质量和准确性方面优于以往方法,可用于增强现实和协作建图应用。
- 基于网格的高斯映射在实时大规模变形中的应用
通过创新的基于网格的高斯喷洒(GS)表示方法,在保持高质量渲染结果的同时,实现了高质量的重构和有效的变形,每秒平均 65 帧。
- NID-SLAM:基于神经隐式表示的动态环境下的 RGB-D SLAM
提出了一种名为 NID-SLAM 的方法,通过增强语义掩膜中的不准确区域和选择关键帧来提高神经 SLAM 在动态环境中的性能。在动态环境中,该方法通过准确删除动态物体来降低相机漂移的概率,从而在跟踪准确性和建图质量方面优于其他竞争性神经 S - 通过具有注意深度融合先验的体渲染学习神经内隐
通过体积渲染和专注深度融合先验进行多视角 RGBD 图像学习神经隐式表示,以准确进行 3D 重建。该方法利用截断有符号距离函数(TSDF)从所有可用的深度图像融合并感知粗糙三维结构,解决了通过体积渲染进行几何推断的不完整深度和被遮挡结构的问 - DORec: 利用 2D 无监督特征的分解对象重建
本研究提出了基于神经隐式表示的 Decomposed Object Reconstruction (DORec) 网络,通过转换 2D 自监督特征为两个粒度级别的蒙版来监督分解,包括指示前景区域的二进制蒙版和指示语义相似区域的 K 聚类蒙版 - ICCVGO-SLAM:一致性 3D 即时重建的全局优化
GO-SLAM 是一种基于深度学习的稠密视觉 SLAM 框架,通过全局优化姿态和三维重建实时改进相机跟踪和重构方面的错误累积问题,并通过有效的闭环检测和在线全捆绑调整支持鲁棒的姿态估计和实时三维重建,同时在运行中实时更新隐式和连续的表面表示 - ICCV坐标量化的神经隐式表示法在多视图重建中的应用
学习神经隐式表示的研究取得了巨大的进展,该研究介绍了使用量化的坐标来减少优化过程中的不确定性和歧义,通过体渲染使用离散坐标和其位置编码来学习隐式函数,从而在多个视图的光线交汇点上触发更多的多视点一致性约束,提高了推断隐式函数的效率。
- 渐进式神经表征用于序列视频编制
本文研究了基于 NIR 的神经序列视频表示方法,提出了一种基于彩票票据假设的逐渐增强的神经视频表示模型 PNR,并在 UVG8/17 视频序列基准上展示了其有效性。
- 自适应特征网格的 NICE-SLAM
本研究提出稀疏 NICE-SLAM,将 Voxel Hashing 思想融入 NICE-SLAM 框架,通过自适应地添加和优化表面附近的体素特征来解决 NICE-SLAM 算法在适应大场景时存储密集而导致的存储空间问题。该方法使用的存储空间 - GamutMLP:一种用于色彩损失恢复的轻量级 MLP
使用多层感知器模型,在色域缩减时在线学习预测被剪裁颜色的值,并在 sRGB 图像元数据中保存该模型以恢复宽域颜色值的有效性,对比曾经的解决方法。在自家构建的 2,200 张图像数据集上进行了评估。
- Vox-Fusion: 利用基于体素的神经隐式表示进行密集跟踪和建图
本文提出了一种名为 Vox-Fusion 的密集跟踪和建图系统,其将神经隐式表示与传统体积融合方法无缝融合。该方法通过采用基于体素的神经隐式表面表示来编码和优化每个体素内部的场景,并采用基于八叉树的结构来划分场景和支持动态扩展,进而实现对任 - 三维感知视频生成
本文探讨了生成对抗网络 (GANs),将神经隐式表示与时间感知区别器相结合,发展了一种 GAN 框架,仅用单目视频合成了 3D 视频,能够学习可分解的 3D 结构和运动的丰富嵌入,实现了新的时空渲染视觉效果,同时也能产生与现有 3D 或视频 - CVPRBNV-Fusion: 使用双层神经体积融合进行密集三维重建
本篇论文提出了一种基于神经隐式表达和神经渲染的双层神经体积融合方法,用于增量式地将新的深度图像融合到全局神经隐式表示中,以实现密集的 3D 重建,评估表明此方法在多个数据集上均得到了显著的改进。