本文提出了一种新的基于图像的城市定位方法,使用图像与 2D 地图之间的语义匹配来表示语义特征,其中的二进制描述符能够更好地适应可变成像条件,而 CNN 分类器则用来检测图像的特征并与地图数据库中的信息进行匹配,这种方法相对于传统的图像数据库匹配更具有可扩展性和人机交互性.
Mar, 2018
在这篇论文中,我们提出了使用结构线索来增强基于图像的位置识别,这是通过利用结构运动获得的,因此不需要为位置识别使用任何其他传感器,这是通过将基于图像的位置识别通常使用的 2D 卷积神经网络与从结构运动点云导出的体素网格作为输入的 3D CNN 相结合来完成的。我们评估了不同的方法来融合 2D 和 3D 特征,并通过全局平均汇集和简单的串联获得了最佳性能。在牛津机器人车数据集上,得到的描述符表现优于仅从一个输入模态性提取的描述符,包括最先进的基于图像的描述符。特别是在低描述符维度下,我们的表现超过最先进的描述符高达 90%。
Feb, 2020
本文研究使用基于空间验证的重新排序方法尝试解决视觉地方识别中光照和遮挡等困难问题,并给出了新的综合基准和两个具有挑战性的数据集。
Apr, 2023
本研究提出一种基于监控学习全局描述符跟踪变化的新型描述符 - Delta 描述符,通过考虑行进路线上观察到的地点之间的时间差异,以无监督的方式缓解原始描述符匹配空间引起的偏移。我们使用两个基准数据集演示了 Delta 描述符在孤立情况下的高性能,进一步通过融合序列匹配方法实现了最新的性能表现,在相机运动方面具有更强的内在鲁棒性,并降低了维数降低时的性能退化率。
Jun, 2020
本研究中,我们建立了从地标特征中提取的描述符,该描述符还编码了视图中地标的空间分布,匹配描述符然后强制实施地标在视图之间的相对位置的一致性,这对性能有显着影响。在 10 个图像对数据集上的实验中,每个数据集都由 200 个城市地点组成,观察位置和条件有显着差异,我们记 录了大约 70% 的平均精度(在 100% 召回率下),而使用整个图像 CNN 特征获得了 58%,[1] 方法获得了 50%。
Aug, 2016
本文提出了一种卷积网络框架,用于学习二进制补丁描述符,其中像素域特征与从变换域提取的特征融合。实验证明,我们的特征融合方法在准确性、速度和复杂性方面优于多种最先进的方法。
Jan, 2019
本研究提出了一种基于光照不变性的二进制特征描述符 (IIB),通过利用多空间粒度中的局部跨补丁不变性来处理恶劣的光照变化,并采用积分图实现局部补丁特征计算的高效 IIB 描述符。数值实验结果表明,所提出的 IIB 描述符优于现有的二进制描述符和一些测试浮点描述符,并已成功应用于长期视觉定位的演示系统中。
May, 2023
该论文提出了一种利用深度学习技术进行分层定位的方法,仅在候选位置上计算 2D-3D 匹配的精确位姿估计,从而实现在流行的移动平台上实时运行并拥有最先进的本地化性能,为机器人研究带来了新的前景。
Sep, 2018
本文提出了一种序列化描述符提取方法,以有效地融合时空信息并生成有区别的描述符,使用滑动窗口来控制时间自我关注范围,并采用相对位置编码来构建不同特征之间的位置关系,从而捕捉帧序列中的固有动态和局部特征运动。
本文提出了一种名为文本视觉深度二进制编码(TVDB)的方法,该方法利用区域卷积网络和文本卷积网络来分别探索图像的区域细节和句子的语义线索,通过交替优化来高效地优化二进制编码和深层编码函数,实验证明此方法能够显著提高跨模态检索的性能。
Aug, 2017