- NoPose-NeuS:联合优化相机姿态与神经隐式表面的多视图重建
NoPose-NeuS 是一种将 NeuS 扩展到联合优化相机姿势、几何和颜色网络的神经隐式表面重建方法,通过将相机姿势编码为多层感知器 (MLP) 并引入多视图特征一致性和渲染深度损失,约束学习到的几何来获得更好的相机姿势和场景表面估计。 - AAAIVSFormer:视觉空间融合 Transformer 用于对应关系修剪
在本文中,我们提出了一种名为 VSFormer 的视觉空间融合转换器,通过交叉关注获取场景的高度抽象视觉线索,进而通过联合视觉空间融合模块将这些视觉线索嵌入到相应的对应关系中,实现对内点的识别和相机姿态恢复,同时通过结合基于 KNN 的图和 - COLMAP 免费的三维高斯糊点
本文研究了神经渲染、相机位姿、Neural Radiance Fields、3D Gaussian Splatting 以及新视角合成等主题,通过使用显式几何表示和输入视频流的连续性,实现了无需任何 SfM 预处理的新视角合成。该方法在大运 - CBARF:基于级联的绑定调整神经辐射场技术在不完全相机位姿下的应用
我们提出了一种新颖的三维重建框架 CBARF,通过级联更新相机姿态和使用邻近替换策略来优化姿态和合成新视角,实验结果表明 CBARF 在姿态优化和新视角合成方面取得了最先进的性能。
- LEAP:从相机姿态中解放稀疏视图三维建模
摘要:本研究论文探讨了在多视角三维建模中,相机姿势是否是必需的问题,并提出了一种名为 LEAP 的新型无姿势方法,该方法通过数据学习几何知识并使用神经体积进行图像聚合,展示了在预测姿势之下,LEAP 相较于现有方法有明显的性能优势,同时运行 - 基于束调整的外科内窥镜动态视频重建,使用神经辐射场
通过采用神经辐射场(NeRF)方法,我们展示了一种能够学习时间上动态且可变形的三维场景的方法,并能适应各种不同相机和场景设置的鲁棒性模型,该模型消除了已知相机姿态的限制,并克服了目前静态场景重构技术中依赖场景静态部分进行精准重构的缺点,为当 - DynaMoN:动态 NeRF 的快速可靠的相机定位
使用动态重建和神经辐射场 (NeRF) 时,准确的摄像机姿态往往难以使用现有的视觉结构重建 (SfM) 流程获取,因为摄像机和场景内容都可能发生变化。我们提出了 DynaMoN,它与运动遮罩相结合来处理动态场景内容的同时定位与建图 (SLA - AltNeRF:通过交替优化深度和姿态学习鲁棒的神经辐射场
AltNeRF 是一个新颖的框架,利用自监督单目深度估计(SMDE)从单目视频中创建具有弹性的 Neural Radiance Fields(NeRF)表示,无需依赖已知的相机姿态,通过交替算法将 NeRF 的输出与 SMDE 融合,生成逼 - SC-NeuS:从稀疏和嘈杂视角进行一致的神经表面重建
本文提出了一种名为 SC-NeuS 的联合学习策略,该策略利用多视角约束从稀疏视图中恢复连续表面重建,并获得了比现有的神经表面重建方法更好的重建结果。
- 无需探测器的运动结构恢复
提出了一种新的无检测器 SfM 框架,通过注意力机制多视角匹配来改善重建精度,适用于缺少纹理的场景,在基准数据集上优于现有基于检测器的 SfM 系统,并取得了 2023 年图像匹配挑战赛的第一名。
- 通过同步局部未优化的 NeRF 获取场景和位姿估计
本文提出了一种名为 LU-NeRF 的方法,通过利用放松姿态配置的放松姿态配置来同时估计相机姿态和神经辐射场,通过局部到全局的优化和姿态同步等步骤, 在一般的 SE(3)姿态设置下,无需对姿态先验进行强制约束,相比先前无姿态配置进行的 Ne - FlowCam:通过像素对齐场景流训练通用的无相机位姿 3D 辐射场
提出了一种联合重构相机位姿和三维神经场表示的在线方法,通过可微分渲染将帧间光流提升到三维场流,通过加权最小二乘拟合场流场估计 SE(3) 相机姿态,同时可以通过重新渲染输入视频对相机姿态估计和通用神经场表示进行监督,从而在真实世界视频数据 - MM基于比较性神经辐射场(NeRF)的 HoloLens 轨迹和运动结构摄像机姿态三维分析
利用 Neural Radiance Fields (NeRFs) 训练高分辨率 3D 重建,包括使用 HoloLens 数据提取内部摄像机姿态和通过结构光运动提取外部摄像机姿态,两者均通过姿态优化得到改善;结果表明,相较于传统的 Mult - 使用相对运动海森矩阵的无意义全局捆绑调整
本文提出了一种新的捆绑调整目标,它不依赖于图像特征的重新投影误差,同时保持与传统捆绑调整相当的精度,通过平均相对运动和局部海森矩阵的加权目标函数,从而隐含地考虑结构信息,利用全局对齐来引导最终优化。
- RePAST:相对姿态注意场景表示变换器
本文提出了一种名为 Relative Pose Attention SRT (RePAST) 的方法,通过将相对的相机位姿信息注入到 Transformers 的注意机制中,使得其对任何全局参考帧的选择都具有不变性,同时仍保留了原始方法的全 - ICLRS-NeRF:街景的神经辐射场
本文提出了一种新的街景神经辐射场模型(S-NeRF),它考虑了大规模背景场景和前景移动车辆的新视角合成,通过改进场景参数化函数和学习更好的神经表示来应对现有 NeRF 模型在街景合成中出现的问题,并使用嘈杂和稀疏的 LiDAR 点来提高训练 - 多分辨率哈希编码下鲁棒相机位姿优化
使用多分辨率哈希编码的联合优化算法可以同时校准相机位置和学习几何表示法,以提高神经渲染的性能和收敛速度。
- CVPRLevel-S$^2$fM: 基于神经隐式面积边界的运动结构恢复
本文提出了一种神经增量结构运动(SfM)方法 Level-S $ ^ 2 $ fM,通过从建立的关键点对应关系中学习坐标 MLPs 来估计相机姿态和场景几何。
- ECCV野外环境下的全景真实头像模拟
为了实现人类交流的沉浸式 3D 体验,需使用像手机摄像头一样的普通硬件获取 360 度的逼真人形头像,并使用经过训练的关键点检测器和多阶段优化过程创建头像。
- ECCVPoserNet:利用物体探测精确优化相机相对姿态
通过使用物体区域指导姿势估计问题,而不是显式语义物体检测,我们提出 Pose Refiner Network (PoserNet)—— 轻量级图神经网络来细化相机姿态的大致成对相对姿态。