室内视觉定位的几何语义姿态验证
该论文提出了一种基于联合三维几何和语义理解的新方法来解决计算机视觉中困难的视觉定位问题,该方法使用生成模型进行描述符学习,并在语义场景补全作为辅助任务进行训练,以使得生成的三维描述符具有鲁棒性,并能够实现在极端视角,光照和几何变化下的可靠定位。
Dec, 2017
本文提出了一种基于结构和图像的语义匹配方法,能够在诸如季节、亮度、天气和昼夜变化等多种条件下实现准确和稳健的视觉定位,实验证明该方法相较于现有技术有显著的提升。
Apr, 2019
本文研究了室内大规模定位中基于景深匹配和虚拟视图合成的视觉方法,通过收集新的大规模数据集进行实验,证明了该方法在 6DoF 姿态预测方面明显优于现有方法。
Mar, 2018
使用新型的激光雷达 SLAM 技术和结构运动优化方法在大型商场和地铁站获取室内数据集以便于在室内环境中进行视觉定位,并测试现代化的视觉定位算法,证明结构基方法使用健壮的图像特征具有更高的性能。
May, 2021
本研究提出使用手机的 GPS、罗盘和重力传感器等附加传感器来解决室外场景下相机定位的挑战性问题,通过开发出直接的二维 - 三维匹配网络和采集公开数据集等手段,证明了该方法的有效性。
Apr, 2023
类别级别姿态估计是一项具有挑战性的任务,近期深度学习方法取得了很大进展,但常常受到需要大量数据集或精心调整的逼真模拟器的限制。为了解决这个冲突,我们提出利用从预训练基础模型中获取的几何和语义特征,通过将 2D 特征从基础模型投影到三维空间来对单个类别的物体模型进行匹配,并在训练好的匹配网络上处理对未见物体实例的新的单视图观测,这比先前方法需要的数据量显著减少。我们通过丰富的评估结果表明了这一点,并展示了比先前方法更好的性能。
Nov, 2023
通过利用少量的标签数据(即相机姿态),本文提出了一种学习方法,将这些标签与刚性对齐相结合,学习场景的三维几何表示,并将其用于估计相机的六自由度姿态,从而提高了定位的准确性。
Dec, 2023
通过使用基于视觉的场景几何形状信息,我们提出了一种用于改善人体姿态估计的新颖机制:多层深度图。我们展示了这种方法可以提高 3D 姿态估计的精度。
May, 2019
本文提出了一种基于图像的定位方法,使用本地特征和稀疏的三维模型进行全球规模的离线和在线实时客户端姿态融合,实现低延迟本地化查询,证明了该方法在大规模模型上的有效性。
Jun, 2019
本文提出一种基于多任务架构的视觉定位方法,通过将几何和语义信息融合到多尺度的嵌入表示中,使用有效的多尺度特征鉴别器进行对抗性训练,从虚拟数据集到现实世界数据集的领域适应,以实现图像检索定位及大规模地点识别。该方法在 Extended CMU-Seasons 数据集和 Oxford RobotCar 数据集上进行验证,结果表明本方法在具有挑战性的环境下的检索定位和大规模地点识别的表现优于现有方法。
Oct, 2020