- 考虑变更检测条件下,通过语义八叉树在点云之间转移外立面标签
使用八叉树结构从已标注点云向未标注点云进行注释传递,通过分析点云间的变化,该方法可以有效地传递注释并解决变化问题,对于自动在两个不同的代表同一实物的点云之间进行标签传递的方法的开发是该项目的主要贡献,该方法对于数据驱动的深度学习算法具有非常 - 神经隐式稠密语义 SLAM
提出了一种利用神经隐式场表示解决室内场景语义 V-SLAM 问题的在线框架,并通过多项实验表明其在测试时间具有精确的跟踪、地图绘制和语义标注能力,能够扩展到 RGB 图像输入,为机器人视觉感知及相关问题提供了可行的解决方案。
- EMNLPSEAL : 交互式系统误差分析和标记工具
这篇论文介绍了一种交互式的 Systematic Error Analysis and Labeling (SEAL) 工具,使用两步法逐步确定高误差片段数据,同时使用语言模型和文本到图像模型来为性能低下的数据集提供人类可理解的语义,从而解 - CVPR实时自我中心物体分割:清华大学读取标签和基准测试结果
本文针对近年来计算机视觉领域中关于自我中心图像物体分割技术的研究,受其在混合现实应用中的重要性所驱动,提供了一个基于 RGB-D THU-READ 数据集的 2124 个图像的语义级别标注,并使用 Thundernet 进行了基准测试,为未 - MMGraNet:针对 ALS 点云分类的全局关系感知注意力网络
本论文提出一种新型神经网络用于对 ALS 点云进行语义标注,名为全局关系感知注意网络 (GraNet),该方法首先使用一个本地空间注意卷积模块 (LoSDA) 学习本地几何描述和本地依赖关系,然后使用全局关系感知注意模块 (GRA) 学习任 - 基于 KITTI 数据集的基于激光雷达的全景分割基准
本文扩展了 SemanticKITTI 数据集,提供了激光雷达数据的语义标注和时间上连续的实例信息,以及两个结合了最新的 LiDAR 语义分割方法和目标检测器的强基线,希望能为 LiDAR 的全景分割算法的开发提供帮助。
- Kimera: 一个实时度量语义定位与建图的开源库
提供一种开源的 C++ 库,为实时度量 - 语义视觉 - 惯性同时定位和制图 (SLAM) 提供支持,通过使得网格重建和三维语义标记成为可能,超越了现有的视觉和视觉惯性 SLAM 库(如 ORB-SLAM、VINS-Mono、OKVIS、R - MM通过自级联卷积神经网络完成超高分辨率图像的语义标注
提出了一种基于 CNN 的新型深度模型(ScasNet),用于在具有高度复杂的城市环境下对非常高分辨率(VHR)图像进行语义标注。ScasNet 通过全局到局部环境聚合和粗到精微的细化策略,以及专用的残差校正方案,大大提高了标记的一致性和准 - 使用卷积神经网络进行大规模建筑物提取:美国地图绘制
通过采用分支卷积神经网络、全卷积神经网络、条件随机场作为循环神经网络以及 SegNet 四种卷积神经网络体系结构,对美国整个大陆分类提取建筑物轮廓线,将符号距离标签与 SegNet 结合,改进了建筑物轮廓线的提取结果并提出了融合近红外信息的 - MMBeyond RGB: 基于多模态深度网络的高分辨率城市遥感技术
本文研究使用深度完全卷积网络来处理多模态多尺度遥感数据的语义标注,并采用有效的多尺度方法来提高语义标注的精度和深入研究数据的早期和后期融合方法,并在两个公共数据集上验证了我们的方法,表现出令人满意的结果。
- 用于三维点云语义标记的全卷积网络
本文介绍了使用一维全卷积网络对点云数据进行语义标记的方法,该方法直接分析经过地形归一化后的点,并结合光谱数据以学习上下文特征。我们的方法不需要手动提取特征,且在多个方面上比传统方法表现更优越,其中包括利用 ISPRS 3D 语义标注竞赛数据 - 利用地球观测和 OpenStreetMap 数据进行联合学习,以获取更快、更好的语义地图
本文探讨在地球观测图像语义标注中使用 OpenStreetMap 数据的潜力。作者在 ISPRS Potsdam 和 DFC2017 两个公共数据集上使用不同的架构并进行了实验,结果发现使用 OpenStreetMap 数据能够显著提高模型 - DA-RNN: 带数据关联的循环神经网络实现语义映射
本文提出了一种数据关联递归神经网络(DA-RNNs)的新框架,它可以将 RGB-D 视频的语义标记与 KinectFusion 等拓扑映射技术相结合,从而将 RGB-D 视频的语义信息注入重建的 3D 场景中,实现了对三维场景地图与语义标记 - CVPR对抗网络调整的场景生成
该研究的目的是通过将生成模型的虚拟数据迭代地逼近真实世界的数据分布,提高计算机视觉系统训练的泛化性能,该方法通过对生成图形模型的参数先验分布进行后验密度估计,结合生成对抗训练,提高了交通场景语义标注任务的性能。
- 融合深度学习和几何建模的自驾车意外障碍检测
利用外观、语境和几何线索,通过一个基于深度学习的完全卷积网络,结合基于模型的统计假设检验的最新检测方法,和一个系统的贝叶斯框架来检测自动驾驶汽车所面临的道路中的障碍物。我们在失物招领数据集上评估了我们的障碍物检测系统,取得了 50% 的相对 - 卷积神经网络进行高分辨率语义标记
本文介绍卷积神经网络在图像语义分割领域的应用,通过深入研究相关架构,提出了更加高效和灵活的 CNN 框架,能够在高分辨率航空影像语义分割任务中取得更好的性能表现。
- 利用循环神经网络修正卫星图像分类地图
本研究提出了一种迭代增强算法,它能够通过训练循环神经网络来直接学习迭代过程,从而有效地改善卫星图像分类地图的质量。
- 使用卷积神经网络实现亚分米分辨率图像的密集语义标注
本文基于卷积神经网络提出了一种深度学习系统,能够在高分辨率的航拍图像上检测地物信息并达到了良好的识别精度。
- ECCVLSTM-CF: 基于 LSTM 的 RGB-D 场景标记中上下文建模和融合的统一
本文开发了一种新型的 LSTM-CF 模型,它可以从多个光度和深度数据通道捕获和融合上下文信息,并将此模型纳入深度卷积神经网络(CNNs),以用于端到端训练,以提高细粒度语义标签的准确性。
- 城市景观语义理解数据集
为解决现有数据集不能很好地捕捉真实城市场景的复杂性,我们引入了 Cityscapes—— 一个基准套件和大规模数据集,用于像素级和实例级语义标注的方法的训练和测试。