- 循环图中的旋转平均:基于原始 - 对偶方法和闭合形式
通过最大似然估计的方法,本文针对旋转平均问题提出了一种新的原始 - 对偶方法,以解决在计算机视觉和摄像机网络标定中使用的非凸高维优化问题,并在多个情境中对该方法进行了基准测试,通过对偶理论验证了解决方案的有效性和性能提升。
- 无初始化的大规模捆绑调整的功率变量投影
基于初始化的无初始化捆绑调整问题的求解方法相对较少,与 Levenberg-Marquardt 算法相比,未充分探索的 Variable Projection 算法展现了宽广的收敛区域,结合对象空间误差构建,最近的研究已经展示了其无初始化捆 - 场景坐标重建:通过增量学习重定位器进行图像集合的姿态估计
我们通过学习基于场景坐标回归的重新定位方法实现了无特征匹配和高效优化的相机姿态估计,从而构建了隐式的神经场景表示。
- 通过解耦旋转和平移实现基于三点线图像的准确实时相对位姿估计
在本文中,我们提出了一种基于旋转 - 平移解耦估计的新型三视图位姿求解器,该方法通过考虑观测的不确定性并使用 Levenberg-Marquardt(LM)算法高效求解旋转估计,以及通过精心设计的稳健线性平移约束,来准确估计旋转和平移,实验 - 放宽三维高斯平铺的准确初始化约束
通过分析频域中的结构化运动初始化和多个一维高斯回归任务的分析,我们提出了一种名为 RAIN-GS(放松 3D 高斯点云精确初始化约束)的新优化策略,成功地从随机点云训练 3D 高斯效果,并通过多个数据集进行定量和定性比较,大幅提高了在所有设 - GaussianPro:3D 高斯散点投射与渐进传播
通过应用渐进传播策略,并利用场景的先验知识和块匹配技术,我们提出了一种名为 GaussianPro 的新方法,来指导 3D 高斯聚类的密度化,验证实验证明了我们的方法在大规模和小规模场景上的有效性。
- 密集匹配器用于密集追踪
本研究论文扩展了 MFT 提出的将多个光流在对数间隔上结合的概念,证明了 MFT 与不同光流网络的兼容性,并展示了在 MFT 框架内的这些网络的简单而有效的组合,从而在长期跟踪应用中超越了它们的个体性能,并在位置预测准确性上与更复杂的非因果 - SCENES: 用极线监督进行子像素对应估计
从两个或多个视图中提取场景的点对应是一个基本的计算机视觉问题,对于相对相机位姿估计和运动结构具有特殊重要性。我们通过使用对应于传递线上的假设匹配来放宽已有模型需要的先验知识约束,并提出了一种新颖的引导方法,从而无需真实的三维结构信息即可对模 - 基于视觉几何的深度结构运动
我们提出了一种新的深度管道 VGGSfM,其中每个组件都是完全可微的,因此可以进行端到端的训练,通过引入新的机制和简化,我们在三个流行的数据集 CO3D,IMC Phototourism 和 ETH3D 上实现了最先进的性能。
- 具有深度前端的分布式全局结构恢复
通过结合特征提取和匹配方面的发展,我们设计了一个模块化的 SfM 框架,旨在研究全局 SfM 与增量 SfM 方法的性能表现,并且实验证明,在不同数据集上,基于深度学习的两视图对应估计在点密度方面有所提升,但仍不如 SIFT 与增量 SfM - 机器人手眼标定:基于运动结构的方法
本文提出了一种新的灵活的手眼标定方法,结合运动估计技术和已知机器人运动,通过线性形式求解手眼参数和结构运动方法中的未知比例因子。该方法适用于无人驾驶车辆、远程工作机器人等领域,并通过与现有方法的对比实验验证了其优越性。
- 利用图注意网络学习运动结构
该论文通过使用图注意力网络解决学习结构运动(Structure-from-Motion)的问题,通过学习模型以 2D 关键点为输入,输出对应的相机姿态和 3D 关键点坐标,实现了快速推理和重建,超过了竞争的基于学习的方法并在较短的时间内挑战 - 无需探测器的运动结构恢复
提出了一种新的无检测器 SfM 框架,通过注意力机制多视角匹配来改善重建精度,适用于缺少纹理的场景,在基准数据集上优于现有基于检测器的 SfM 系统,并取得了 2023 年图像匹配挑战赛的第一名。
- FlowCam:通过像素对齐场景流训练通用的无相机位姿 3D 辐射场
提出了一种联合重构相机位姿和三维神经场表示的在线方法,通过可微分渲染将帧间光流提升到三维场流,通过加权最小二乘拟合场流场估计 SE(3) 相机姿态,同时可以通过重新渲染输入视频对相机姿态估计和通用神经场表示进行监督,从而在真实世界视频数据 - CVPR重新审视旋转平均:不确定性与鲁棒损失
本论文提出一种改进的旋转平均方法,通过直接将不确定性从点对应中传播到旋转平均中来模拟基础噪声分布,同时探索了将 MAGSAC 损失整合到旋转平均问题中的可能性,较之传统的健壮损失方法在大规模公共基准测试中的精度更高。
- ECCVParticleSfM:利用稠密点轨迹定位野外运动相机
提出了一种基于密集间接结构运动方法的鲁棒性摄像机姿态估计方法,利用密集对应初始化并优化长程视频对应关系作为密集点轨迹并用于学习运动分割的鲁棒估计;实验表明我们的系统相对于现有最先进方法在 MPI Sintel 数据集上产生了更准确的摄像机轨 - 分秒之间的旋转平均值:一种基于原始对偶方法和闭合形式的循环图算法
本文从最大似然估计的角度出发,提出了一种新的无需初始化的原始 - 对偶方法来解决旋转平均问题,同时,在循环图中得出了旋转平均的第一个闭合解,这一方法在精度和性能方面都有了显著的提升。
- 深度监督下的 NeRF:更少的视角和更快的训练
通过引入深度监督机制,结合 SFM(结构光运动)得到的 “自由” 深度监督信息,在学习 Radiance Fields 的过程中对射线的结束点进行分布的损失函数,并且证明这种监督方式简单有效,可以使得渲染图像更加精准,支持其它类型的深度监督 - CVPR深度二视图结构运动再探讨
本研究使用光流、姿态估计和深度估计网络,实现了相对摄像机位姿和深度图的两视角结构运动重建,表现明显优于现有的同类方法。
- ICCV经过校准或部分校准的半广义单应矩阵
该论文提出了从场景平面引出的五个二维 - 二维图像点对应所能获得的对于半广义单应性的第一种最小解决方案。其中一个解决器假设透视相机完全校准,而另一个解决器则估计未知的焦距和绝对姿态参数。