- 双视:几何引导的深度估计
我们的方法通过在网络中添加最新的 3D 几何数据作为额外输入,结合之前的几何提示,利用深度和 3D 场景重建领域中的先前工作,实现了与实时交互速度相比达到最先进的深度估计和场景重建。
- VDG:基于视觉的动态高斯驾驶仿真
将自我监督视觉里程计(VO)集成到动态高斯方法(VDG)中,从而提升了定位和深度初始化以及静态 - 动态分解,VDG 可以只使用 RGB 图像输入,在更快的速度和更大的场景下构建动态场景,并在大量定量与定性实验中展示了对于现有动态视图合成方 - Flash3D:来自单幅图像的前馈式通用三维场景重建
提出了一种名为 Flash3D 的方法,用于从单个图像进行场景重建和新视角合成,具有很强的通用性和高效性。该方法基于基本模型进行深度估计,并使用高斯分层预测场景的 3D 形状和外观,利用高斯散点处理进行扩展。该方法训练效率高,在 RealE - CVPR极化波前激光雷达:从极化波前学习大场景重建
该研究介绍了一种新颖的长距离极化波前激光雷达传感器(PolLidar),利用极化波前估计室外场景中的法线、距离和材料特性,并提高了场景重建的准确性。
- 门控场景学习:从门控视频中学习场景重建
通过利用时间观察重建室外三维场景是一个具有挑战性的问题,本文介绍了一种利用神经场的新方法 - Gated Fields,它结合了主动门控视频序列和光照,在各种环境光照条件下实现了精确且密集的几何重建。
- DistGrid:具有分布式多分辨率哈希网格的可扩展场景重建
基于多分辨率哈希格方法的可扩展场景重建方法,通过划分大型场景、消除背景 NeRF,并利用分割体积渲染方法处理跨边界射线,实现了更高质量、更可扩展的场景重建。
- 高斯平铺是否需要 SFM 初始化?
研究表明,通过巧妙设计的随机初始化和低成本 NeRF 模型的结构提炼,可以在不依赖 SFM 数据的情况下实现与 SFM 初始化相当甚至更好的结果。
- 仅进行一次扫描:一种用于 6 - 自由度机器人抓取新物体的动态场景重建流程
该研究论文介绍了一种动态场景重建的新型双阶段流程,通过绕过遮挡的限制,持续捕捉不断演化的场景几何形状,从而增强整体抓取规划过程,并使最先进的 6 自由度机器人抓取算法展示出明显的改进精度。
- CVPR总体分解:最小交互下的三维场景重建
该研究论文提出了一种名为 Total-Decom 的方法,使用少量人工干预实现了 3D 场景的精确重建和实时控制,通过结合 Segment Anything Model (SAM)、混合隐式 - 显式神经表面表示和基于网格的区域生长技术实现 - 高斯喷洒移动:针对自然相机运动的模糊和快门滚动补偿
基于高斯子图的高质量场景重建和新视图合成通常需要稳定、高质量的照片,这往往难以通过手持相机捕捉。本文提出了一种适应相机运动、能够利用受运动模糊和滚动快门衍生的手持视频数据实现高质量场景重建的方法。我们的方法基于对物理图像形成过程的详细建模, - DRSM:用于静态单目摄像机中的动态重构的高效神经 4D 分解
通过使用单个视图,我们提出了一个新的框架来解决动态场景的四维分解问题,并通过密集光线投射强调动态区域的学习,从而克服了单个视图和遮挡带来的挑战,并实现了比现有方法更高保真度的单视图动态场景表示。
- PLGSLAM:基于本地到全局捆集调整的渐进神经场景表示
PLGSLAM 是一种神经视觉 SLAM 系统,能够实时进行高保真度的场景重建和强健的相机追踪,在大规模室内场景下表现良好。
- DrivingGaussian: 周围动态自动驾驶场景的复合高斯喷洒
DrivingGaussian 是一个高效而有效的框架,用于重建自主驾驶场景中的动态环境,通过顺序和渐进地建模静态背景,并利用动态高斯图来处理多个移动物体,在场景中恢复每个物体的准确位置和遮挡关系。使用 LiDAR 和高斯喷洒方法进行重建, - 高质量神经渲染的各向异性神经表征学习
通过学习隐式体积表示来改善场景表示和重建的方法,利用学习的视角相关特征将体积函数建模为球谐(SH)引导的各向异性特征,通过参数化多层感知机提高渲染质量,并通过能量正则化实现鲁棒的场景重建,该方法可在基于 NeRF 的框架中应用。广泛的实验证 - LightGaussian: 无界的三维高斯压缩,15 倍减少和 200 + 帧每秒
LightGaussian is a novel method for efficient 3D representation that reduces redundancy, distills spherical harmonics, a - ICCV光子构景
在高速运动和低照明条件下的场景重建是许多应用(如增强和虚拟现实、无人机导航和自主机器人)中的重要问题。本文介绍了一种能够从高速图像序列(如由单光子相机捕获的序列)中估计极端场景运动的方法,在低光或高动态范围等具有挑战性的条件下表现出色。
- RICo:通用场景重建的旋转 - 修复 - 完整方法
通过结构化将问题分解为补全和 2D 到 3D 场景转换两个步骤,本文提出了一种场景重建的方法。通过利用大型语言模型来补全从不同视角渲染的场景彩色图像中的缺失区域,然后通过预测补全图像的法线并解决缺失深度值的方法来将这些补全图像转换为 3D。 - DreamEditor: 使用神经场进行文本驱动的 3D 场景编辑
本文提出了 DreamEditor,一种使用文本提示对神经场进行编辑的新框架,用于场景重建,可以实现精确编辑神经场保持平滑的几何纹理,并且在定量和定性评估中明显超过以前的工作。
- C2F2NeUS:用于高保真和通用神经表面重建的级联成本截锥体融合
本文介绍一种新的多视角立体 (MVS) 和神经隐式表面 (NIS) 相结合的方案,该方案结合了两种技术的优势,通过构造每视角代价锥提高几何精度,融合不同视角锥并估计隐式符号距离函数来解决噪声和孔洞问题,并通过级联锥融合策略有效捕捉全局 - - 二元辐射场
本文提出了一种存储效率高、能够编码局部特征的二进制辐射场表示,其二进制化策略让我们能够使用高度紧凑的特征编码来表示功能网格,并显著减小存储器的大小。在静态场景的重建性能上,我们的模型可以达到令人印象深刻的结果。