从相机姿态恢复场景内容 —— 保护隐私的表征不足
本文提出了一种将已知场景的 Structure-from-Motion point cloud 转换成不易理解的 3D lines 的 'line cloud' 表示法,以保护用户生成内容的隐私,同时探讨了从这种表示法中恢复图像信息的方法,并通过实验证明了它的可行性。
Mar, 2021
本文探讨了互联网上获取的 3D 模型对于视觉定位的不精确性以及如何处理构建一个更加准确的场景表示,研究人员创建了一个基准测试,以评估基于多个 3D 模型的视觉本地化问题的准确性。
Apr, 2023
该研究提出了一种隐私保护的 Visual SLAM 框架,它可以在实时环境下使用混合线条和点云来估计相机姿态和执行束调整,并采用线云图进行优化,以实现预期的隐私保护和实时性能。
Jul, 2020
通过利用少量的标签数据(即相机姿态),本文提出了一种学习方法,将这些标签与刚性对齐相结合,学习场景的三维几何表示,并将其用于估计相机的六自由度姿态,从而提高了定位的准确性。
Dec, 2023
通过探索一种基于密集三维网格的更为灵活的方法,本文旨在解决基于图像的特征匹配对在构建场景表示上造成的代价,并通过在渲染场景几何图形时提取特征的方式,展示了这一方法达到了最新成果。结果表明,基于密集三维模型的表示是现有表示的一种有前途的替代方案,并且为未来研究提出了有趣而具有挑战性的方向。
Jul, 2022
该研究论文研究了视觉定位中图像检索方法对定位性能的影响,并提出了专为定位场景设计的检索方法的需求。通过引入基准测试和多种 “地面真实性” 定义以及针对经典地标检索或地点识别任务的检索效能的分析,探讨了这种影响。
May, 2022
本研究旨在解决场景中精确的相机姿态估计的视觉定位问题,传统方法使用 3D 几何学,而新近出现的卷积神经网络则直接从输入图像中学习相机姿态,但是并未达到 3D 方法的精度。本论文提出了一种理论模型来预测 pose regression 技术的失败案例,并证实了我们的预测。作者进一步表明,pose regression 与图像检索非常相似,而不是与 3D 结构的准确姿态估计。最重要的是,当前方法并不能持续超越手工图像检索基线,因此需要进一步的研究。
Mar, 2019