- 使用深度集合的共识学习进行本质矩阵估计
给出两幅图像中提取的点匹配集合,我们的方法通过使用 Deep Sets 基于简单网络架构来识别离群点匹配,并对内点匹配中的位移噪声进行建模。通过加权的 DLT 模块,我们的网络实现了比现有复杂网络结构更准确的关键矩阵恢复。
- MM基于神经辐射场的工业机器人应用中的新视角合成
本研究评估了 Neural Radiance Fields 在工业机器人应用中的潜力,并提出了一种替代 Structure from Motion 预处理的方法,通过基于机器人运动学的度量尺度确定了精确的相机姿态,表明在具有挑战性的场景中具 - 通过知识蒸馏增强单视景物补全的自监督学习
通过融合多个图像的密度场,我们提出了一种更准确的单视图场景重建方法,特别适用于遮挡区域。
- 任意项目视图数量的关键配置分类
用最近发展的代数方法对投影相机的所有临界配置进行分类,发现它们是众所周知的代数曲面和度数最多为 4 的曲线;还通过发现之前未知的临界配置和证明一些之前被认为是临界的配置实际上并非如此,改进了以前的研究结果。
- LOSTU: 快速、可扩展和不确定性感知的三角测量
本研究介绍了一种名为 LOSTU 的快速、可扩展和统计优化的三角测量方法,与传统的 L2 三角测量方法相比,LOSTU 在三维重建误差方面表现更好,能够成功三角测量更多的点,并且比 Levenberg-Marquardt(或类似的)优化方案 - LocoNeRF:一种基于 NeRF 的局部运动结构方法用于精确定位
提出了一种利用运动感知结构(Structure from Motion,SfM)技术,通过利用神经辐射场(Neural Radiance Fields,NeRF)技术来提高视觉定位精度的新方法,并进行了与现有方法的存储和精度比较。
- 在视频数据中传播语义标签
通过结合基于 SfM 的 SAM 模型将视频中的目标进行分割和跟踪的方法,提出一种减少手动注释工作量的视频对象跟踪系统。系统性能经过计算时间、与手动标签的掩码 IOU 和跟踪损失数量等三个指标的评估,结果表明该系统在跟踪视频帧中的物体方面较 - 现场 SfM: 你所捕捉的就是你所得的
通过使用词汇树对新拍摄的图像进行快速检索,然后采用最小二乘法进行鲁棒特征匹配,并通过优化实现高效的分层加权局部捆绑调整,实现了在线拍摄时图像的实时注册。
- ICCV三维面部重建的分离姿势和形状
提出了一种深度学习技术结合三维可塑模型(3DMM)进行三维人脸重建的方法,通过结合结构运动(SFM)和多视图立体(MVS)技术,构建了一个端到端的流水线,用于稳定准确地求解姿态和形状,并在量化和质量结果方面显示出明显的改进。
- 通过扩散辅助束调整解决姿态估计问题
该研究提出了一种基于概率扩散模型的摄像机姿态估计方法,能够在解决传统方法难以处理的问题方面有所改善,并在两个真实世界数据集上取得了很好的效果。
- 基于深度矩阵分解的旋转同步
本文研究了利用深度神经网络进行矩阵分解的方法来实现旋转同步,从而使得相对位置转化为绝对位置。实验表明该方法在大多数场景下具有与最佳竞争者相当的准确性,并且工作在较弱的假设下。
- 红外传感器的光度校正
该研究探讨了一种基于温度恒定的红外传感器光度校正模型,将其整合至 SfM 框架中用于 3D 重建,实验结果表明光度校正有助于提高相机运动和场景结构的估计,同时与使用 RGB 传感器相比重建质量表现相当。
- 结构光中的语义验证
本文探讨将语义分割技术整合进 Structure from Motion (SfM) 中,通过利用卷积神经网络对输入图像进行像素标记,进而应用于 3D 点云的估算,并比较标记语义的关键点。在一个重复建筑场景的数据集上进行了验证,提出了一种改 - CVPR鲁棒动态辐射场
本研究中,我们介绍了一种新方法,通过联合估计静态和动态辐射场以及相机参数来解决使用 SfM 算法估计相机姿态时的不稳定性问题,实验证明此方法比现有的动态视图合成方法表现优异。
- Geo-Neus: 多视角重建的几何一致神经隐式曲面学习
该论文提出了一种几何一致的神经隐式表面多视图重建方法,该方法利用多视觉几何约束和稀疏几何结构信息,结合有符号距离函数优化,以获得高质量的表面重建结果。
- CVPR贪心参数搜索优化淘汰模板
提出了一种新的构造消元模板的方法,以解决最小化问题的多项式系统的高效求解,在计算机视觉中应用广泛,能够显著减少求解方法的时间和空间复杂度。
- 跨宽基线的图像匹配:从理论到实践
本文介绍了一个用于本地特征与鲁棒估计算法的全面基准测试,旨在通过相机位姿的准确性作为主要指标。我们的管道模块化结构允许易于集成、配置和组合不同的方法和启发式算法。同时我们展示了如何嵌入数十种流行算法进行评估,进而表明经典算法在适当的设置下可 - CVPR使用学习特征描述符的极度密集的点对应关系
本论文提出了一种有效的自监督训练方案和新的损失设计用于密集描述符学习。在对比 in-house 鼻窦内窥镜数据集和公共密集光流数据集以及小规模公共 SfM 数据集的实验中,我们证明了我们提出的密集描述符具有更好的泛化性能,显著提高了 Str - ECCVDeepSFM: 通过深度束调整实现结构运动
本研究设计了一种以物理驱动的 DeepSFM 体系结构,对深度和姿态进行估计,在显式结构约束和深度学习技术的共同作用下,实现了与传统 BA 和新兴深度学习技术的优点相结合的分离拍摄下位姿和深度估计
- NeuRoRA:神经鲁棒旋转平均
该研究提出了一种基于神经网络的方法,将传统图像定位模型的迭代优化方法替换为两个网络之间的组合,该组合由视图图形清理网络和微调网络组成。