本文提出利用无监督学习的方法发现物体的不同部位,通过神经网络构建特征并实现物体识别和部位检测。
Dec, 2020
这篇论文介绍了一种基于 Transformer 的自适应语义聚集方法,将部分作为图像中最具代表性的语义,并将部分级别的特征分解为所有补丁特征的自适应总和,以实现准确的无人机 - 卫星图像匹配。
Jan, 2024
本文提出了一种基于部分匹配区域的方法,使用概率霍夫变换在多个对象类别的嘈杂图像集合中无监督地发现和定位支配对象,并在标准测试基准上证明了该方法在物体共现方面显著优于现有技术,可在具有挑战性的混合类数据集中实现鲁棒的对象发现。
Jan, 2015
本文在单目 SLAM 框架中嵌入了实时深度学习的目标检测器,将普通物体表示为四面体,进一步细化物体重建,检测附加平面标志并建模为独立地标志,可大幅提高系统的定位性能和语义地图的丰富程度。
Sep, 2018
本文介绍了一种基于单张图像强度数据的密集场景几何表示方法,在单目稠密 SLAM 系统中具有优异的性能表现。
Apr, 2018
本文提出了一种基于结构和图像的语义匹配方法,能够在诸如季节、亮度、天气和昼夜变化等多种条件下实现准确和稳健的视觉定位,实验证明该方法相较于现有技术有显著的提升。
Apr, 2019
本文提出了一种新的基于图像的城市定位方法,使用图像与 2D 地图之间的语义匹配来表示语义特征,其中的二进制描述符能够更好地适应可变成像条件,而 CNN 分类器则用来检测图像的特征并与地图数据库中的信息进行匹配,这种方法相对于传统的图像数据库匹配更具有可扩展性和人机交互性.
Mar, 2018
本论文将最新的深度学习方法与基于视频流的半稠密 SLAM 相结合,在室内 / 室外数据集中得到了更好的 2D 语义标签识别,无需针对序列中的每一帧获得语义分割,其时间复杂度也得以合理控制。
Nov, 2016
我们介绍了 PartSTAD,一种用于 2D 到 3D 分割转换的任务适应方法。我们的实验在 PartNet-Mobility 数据集上展示出了显著的改进,与当前 few-shot 3D 分割模型相比,语义和实例分割的 mIoU 增加了 7.0% p,mAP_50 提高了 5.2% p。
一个新颖的开放式同步定位与地图构建(SLAM)框架,通过分割方法在无结构环境中创建对象地图和对象之间的几何关系以进行定位,该方法相对于传统基于特征和全局描述符的 SLAM 系统更具鲁棒性,在照明和外观变化方面表现更好,并且在定位性能方面超过了基准方法。