- CVPR鲁棒动态辐射场
本研究中,我们介绍了一种新方法,通过联合估计静态和动态辐射场以及相机参数来解决使用 SfM 算法估计相机姿态时的不稳定性问题,实验证明此方法比现有的动态视图合成方法表现优异。
- 一种轻量级的领域自适应绝对位姿回归器,使用巴洛双子目标
提出了一种面向绝对姿态回归的领域自适应训练框架,基于生成方法实现场景图像的不同领域的数据增强,并在回归头中探究了空间和通道注意力对旋转预测的有效性。结果表明,该方法在效率和性能方面都优于基于 CNN 的架构,并可适用于不同领域。
- ECCV为自我中心视频估计更多的相机姿态对于 VQ3D 至关重要
通过设计新的 pipeline 并重新优化现有的 VQ3D 框架,我们在 VQ3D 排行榜中取得了 25.8% 的最佳成绩,比基线 8.7% 提高了两倍。
- CVPR重温卷帘快门束调整:朝着准确和快速的解决方案
提出了一种基于滚动快门相机的相机姿态估计和环境几何估计的鲁棒快速 Bundle Adjustment 解决方案,该方案采用了标准化和协方差标准化加权的组合,避免平面退化,并针对其雅可比矩阵和舒尔补的稀疏性进行加速。
- ECCVMeshLoc:基于网格的视觉定位
通过探索一种基于密集三维网格的更为灵活的方法,本文旨在解决基于图像的特征匹配对在构建场景表示上造成的代价,并通过在渲染场景几何图形时提取特征的方式,展示了这一方法达到了最新成果。结果表明,基于密集三维模型的表示是现有表示的一种有前途的替代方 - ECCVParticleSfM:利用稠密点轨迹定位野外运动相机
提出了一种基于密集间接结构运动方法的鲁棒性摄像机姿态估计方法,利用密集对应初始化并优化长程视频对应关系作为密集点轨迹并用于学习运动分割的鲁棒估计;实验表明我们的系统相对于现有最先进方法在 MPI Sintel 数据集上产生了更准确的摄像机轨 - 通过多摄像头系统中的特定位置子选择改进最坏情况视觉定位覆盖率
通过将地图分割为多个不同区域并为每个区域配置单独的参数,该论文大大提高了特定场景下自主车辆 6-DoF 视觉定位的性能,适用于在已知路径上的自主车辆。
- CVPR虚拟对应:以人类作为极端视角几何的线索
该研究提出了一种基于虚拟对应关系的方法,可在极限视角图像中恢复相机的空间布局和场景的几何形状,以及在场景重建和新视角合成等下游任务中发挥作用。
- CVPRFvOR: 面向少视角物体重建的鲁棒联合形状与姿态优化
本文基于学习的方法提出一种多视角 3D 物体重建算法 FvOR,该算法利用神经网络模块快速、准确地估计 3D 几何和相机位姿。我们在 ShapeNet 上进行了大量测试,结果表明该方法不仅取得了最佳的重建效果,而且比目前最新的 IDR 算法 - CVPRDiffPoseNet: 直接可微相机位姿估计
本文提出了一种基于深度学习的方法 NFlowNet,通过直接法而非经典的视觉 SLAM 方法,通过图像梯度来估算相机的位姿,实现了对于姿态的倒易约束,经实验证明该方法的泛化性能较好并优于其他已有方法。
- AAAI通过几何约束从单张图片学习预测三维车道形状和相机姿态
本研究提出了一种基于两个阶段的框架,通过从单个图像中估计相机姿态来预测 3D 车道,使用辅助的 3D 车道任务和几何约束来获得多任务学习的好处,增强 3D 和 2D 之间的一致性和在这两个任务之间的兼容性,在没有地面真值相机姿态的情况下,我 - AirDOS:基于关节物体的动态 SLAM 优化
本文提出了一种名为 AirDOS 的动态对象感知系统,通过引入刚性和运动约束来建模复杂的关节运动物体,可以联合优化摄像机位姿、物体运动和 3D 结构,以改善在挑战性人口密集型城市环境中的视觉 SLAM 算法的鲁棒性,并为动态物体和静态场景生 - 使用图神经网络和相对姿态监督的视觉相机定位
本研究提出了一种基于姿态回归网络和图神经网络相结合的视觉重新定位方法,可在没有内参信息的情况下达到与绝对姿态回归网络相当的准确性,同时保持相对姿态回归模型的高测试速度和对非训练场景的适用性。
- ICCV稀疏视图下平面表面重建
本文提出一种在未知相机姿态下采用多视图重建室内场景中平面表面的方法,并且通过实验表明该方法在来自 Matterport3D 挑战性场景的稀疏视图的重建方面能够推进现有技术的发展。
- CVPR回到未来:从像素到姿态学习鲁棒的相机定位
本研究利用深度神经网络进行对物体在已知场景下的姿态估计,其中提出了使用场景无关的神经网络模型 PixLoc,通过特征学习和度量学习方法将相机定位问题转换为多尺度特征直接对齐,该模型以像素数据作为输入并经过端到端训练后能够在大型环境中实现定位 - 神经重投影误差:融合特征学习和相机位姿估计
本文提出了神经投影误差作为重合问题与特征学习问题的结合,使用粗 - 细优化方法极大地提高了定位精度和鲁棒性。
- 基于采样的场景空间视频处理
本文提出了一种基于采样的新型视频处理框架,旨在实现高质量的场景空间视觉效果,通过像素采样和过滤的方法,针对深度和摄像头姿态估计不可避免的误差问题进行解决,该方法可以广泛地应用于包括降噪,去模糊,爆炸物识别等视频处理领域。
- ICCV一致性学习逐步对应关系剪枝
本文提出了一种基于一种局部到全局一致性学习过程的 “修剪” 块来逐步修剪对应关系的算法,能在鲁棒直线拟合、相机位姿估计以及基于检索的图像定位基准测试中以显著的优势胜过现有算法,并展现出对不同数据集和检测器 / 描述符组合的良好泛化能力。
- ECCV准确的主动相机定位
提出一种新型的主动摄像机定位算法,包括一个被动和一个主动模块,前者通过建立点对点的相机与世界的对应关系,在连续的位姿空间中优化相机位姿,后者则显式地建模场景和相机的不确定性部件以规划精准摄像机位姿估计的路径。
- 基于视觉定位的高效场景压缩
本文提出了一种利用约束二次规划方法对 3D 场景重建的子集进行压缩,采用支持向量机的辅助序列最小优化算法来求解,得到准确的摄相机姿态估计。