- MVSBoost:一种高效的基于点云的 3D 重建
通过结合多视角全景图像、鲁棒的相机位姿估计、先进的图像处理以及点云密度化、网格重建和纹理生成等技术,本论文提出了一个增强型的多视角立体重建框架,显著提高了传统方法的准确性和精度,在处理遮挡和视角变化的复杂场景重建方面表现出了优异的计算效率和 - Toon3D: 以新视角看动画
通过 2D 绘画不一致性校正来恢复手绘图像的 3D 结构,并实现插入未曾绘制过的视角进行卡通重建。
- DepthMOT:深度线索引导强大的多目标追踪器
通过实现深度感知和相机姿态估计,本文提出了 DepthMOT 算法,可以准确区分多个对象,并解决了拥挤场景中物体混淆和相机运动不规则导致的 ID 切换问题。在 VisDrone-MOT 和 UAVDT 数据集上的广泛实验表明 DepthMO - WHAC: 世界凝视的人类与摄像机
利用摄像头视频准确地估计人体和摄像头在世界坐标系中的轨迹是一个既希望实现又具有挑战性和没有确切解的问题。该研究旨在通过充分利用世界、人体和摄像头之间的协同作用,共同恢复富有表现力的参数化人体模型(即 SMPL-X)和相应的摄像头姿势,基于两 - IFFNeRF:从单一图像和 NeRF 模型中的初始无需初始化且快速的 6DoF 姿态估计
我们介绍了 IFFNeRF 以估计给定图像的六自由度(6DoF)相机姿态,基于神经辐射场(NeRF)的形成。IFFNeRF 专门设计用于实时操作,并消除了需要靠近所需解的初始姿态猜测的需求。IFFNeRF 利用 Metroplis-Hast - ICLR相机作为光线:通过光线扩散进行姿态估计
基于光线组合的相机姿势的分布式表示以及基于回归和扩散的方法,在 CO3D 数据集上展现了最新的性能,并在未见过的物体类别和野外捕捉中表现出广泛适应性。
- 使用扩散模型从物体姿态间获得极端的两视图几何
利用物体先验知识,本文提出一种有效的方法,通过合成新视图图像来确定物体姿态,从而准确确定两个视图的相机姿态,并且在大视角变化下展现出卓越的稳健性和泛化性能。
- SCENES: 用极线监督进行子像素对应估计
从两个或多个视图中提取场景的点对应是一个基本的计算机视觉问题,对于相对相机位姿估计和运动结构具有特殊重要性。我们通过使用对应于传递线上的假设匹配来放宽已有模型需要的先验知识约束,并提出了一种新颖的引导方法,从而无需真实的三维结构信息即可对模 - 从立体图像对中无需姿态的新视角合成中统一匹配、姿态和 NeRF
这项工作涉及从立体对生成无姿态新视角合成的任务,在 3D 视觉中是一个具有挑战性和开创性的任务。通过设计一个利用共享表示的架构,无缝集成 2D 对应匹配、相机姿态估计和 NeRF 渲染,促进这些任务的协同增强,我们在整个模型准确性上通过提议 - 从对应关系到姿态:非极小化、可证优化的无需消歧的相对姿态估计
该论文通过将相对位姿估计建模为一个二次约束二次规划问题,直接从对应关系中估计正确的相对相机位姿,绕过后续的唯象几何约束的加强处理步骤,通过详尽的合成和实际实验证实了该方法的有效性、高效性和准确性。
- 第三类型的对应关系:从物体反射中估计摄像机姿态
通过引入第三种相应类型(反射相应)并展示其能够通过观察物体而不依赖于背景来帮助估计相机姿态,本文展示了计算机视觉长期以来依赖于像素相应和三维相应的另一种可能。通过在物体表面反射的场景中进行点相应,解决了由几何和辐射导致的像素和三维相应的错误 - PF-LRM:用于联合姿态和形状预测的无姿态大型重建模型
我们提出了一种无姿势大重建模型(PF-LRM),可以从少数非姿势图像中重建三维物体,即使视觉重叠很少,同时在单个 A100 GPU 上估计相对相机姿势,仅需约 1.3 秒。PF-LRM 是一种高度可扩展的方法,利用自注意力块在三维物体标记和 - 机器人手眼标定:基于运动结构的方法
本文提出了一种新的灵活的手眼标定方法,结合运动估计技术和已知机器人运动,通过线性形式求解手眼参数和结构运动方法中的未知比例因子。该方法适用于无人驾驶车辆、远程工作机器人等领域,并通过与现有方法的对比实验验证了其优越性。
- 神经外科术中学习预期外观进行术中注册
我们提出了一种新颖的方法,通过学习预期的外观来进行术中患者到图像的注册。我们的方法利用术前成像合成手术显微镜下的特定于患者的预期视图,针对一系列预测的变换。我们的方法通过最小化光学显微镜下术中 2D 视图与合成预期纹理之间的差异来估计相机姿 - 懒人式视觉定位通过运动平均
通过针对数据库查询对获得的运动平均化的定制,我们展示了一种可以在不重建三维场景的情况下实现高定位准确性的方法,即 LazyLoc,它在多查询协同定位和相机支架等复杂配置方面表现出了多样性。
- ICCV基于几何引导的跨视角 Transformer 提高 3 自由度地对卫星相机定位精度
本篇论文提出了一种增加地面摄像头位置和方向准确度的方法,通过估计地平线图像和卫星图像之间的相对旋转和平移,设计一种几何引导的交叉视图转换器,构建一个强大的神经姿态优化器来估计它们之间的相对旋转,通过空间相关性生成车辆位置的概率图,并明显优于 - 通过扩散辅助束调整解决姿态估计问题
该研究提出了一种基于概率扩散模型的摄像机姿态估计方法,能够在解决传统方法难以处理的问题方面有所改善,并在两个真实世界数据集上取得了很好的效果。
- BAA-NGP: 捆绑调整加速神经图形基元
本文提出了一种基于加速采样和哈希编码的框架 BAA-NGP,它能够加快位姿估计、场景重建和新视角合成的处理速度,并在不降低位姿估计质量的情况下,比其他基于束调整的神经辐射场方法提高了十倍至二十倍的速度。
- 无需对应的双视角几何评分
该论文研究基于 RANSAC 的两视图几何相机位姿估计问题,并提出一种名为 Fundamental Scoring Network 的新方法,它利用双视图几何模型中的极线注意力机制来预测两幅图像的位姿误差。该方法能够成功地估计出图像间的好的 - 学习如何在内窥镜视频中稳健地估计相机姿态
该研究提出一种基于双目内窥镜深度估计和光流的深度声明网络,通过减小两个几何损失优化相机姿态估计,并且引入了两个自适应的像素权重映射来平衡贡献,实现在挑战性的内窥镜手术场景中更加鲁棒的相机姿态估计,具有推进微创外科领域相关任务(如 SLAM