- 基于 Dempster-Shafer 证据理论的非道路环境中的不确定性感知语义地图构建
通过将证据推理、Evidential Deep Learning(EDL)和 Dempster's combination rule 应用于语义映射,提出了一种证据语义映射框架,以在感知挑战环境下改善不确定性地图的可靠性,并显示与最佳语义映 - 映射未知:使用基础模型的统一提示式全景映射与动态标注
通过使用自然语言提示词,我们介绍了统一的可提示全景映射(UPPM)方法,将动态标注策略与传统的全景映射技术相结合,实现实时、按需的标签生成,并在场景重建中表现出良好的适应性和多功能性。
- LOSS-SLAM: 轻量级开放集合语义同时定位与地图构建
基于对象的开放式语义定位与映射(SLAM)系统通过紧密耦合的概率图模型来识别、定位和编码对象,以实现更准确的 SLAM,并承担较低的计算开销。
- 不确定性感知贝叶斯核推断下的越野环境证据性语义建模
提出了一种基于证据的语义映射方法,通过将证据深度学习集成到语义分割网络中,获得语义预测的不确定性估计,并将此不确定性融入到一个能够在感知性环境具有挑战性的场景中提高可靠性的不确定性感知成核推理中,通过自适应处理语义不确定性,在之前未见过的环 - 在室内环境中进行高层语义区域划分而无需物体识别
通过室内环境中的具身导航,提出了一种语义区域绘图的方法,通过视觉 - 语言模型向导绘图,将自身场景理解映射到全局框架上,生成具有高级代理知识的语义地图,实现自主地图生成。在逼真模拟器的实验中,该方法在大量基线方法中明显优于基于对象的系统和预 - FM-Fusion: 基于视觉 - 语言基础模型的实例感知语义映射增强
基于视觉 - 语言基础模型,本研究提出了一种概率标签融合方法,用于从开放集标签测量中预测闭合集语义类别,以增强基于实例感知的语义映射;通过整合各模块构建一个统一的语义映射系统,并通过 ScanNet 和 SceneNN 数据集评估了方法的零 - 我们能约束概念瓶颈模型学习语义有意义的输入特征吗?
概念瓶颈模型是一种具有内在可解释性的模型,本文研究了如何通过细粒度概念注释的数据集学习概念,并通过移除问题概念相关性来实现概念与输入特征之间的语义映射,通过引入基于纸牌领域的合成图像数据集作为未来研究的基准,以及在胸部 X 光数据集上的实证 - Spot: OSM 中用于地理搜索的自然语言接口
介绍了一种名为 'Spot' 的用户友好型自然语言界面,通过语义映射和 T5 转换器,能够从用户输入的句子中提取相关信息,并在地图上显示匹配描述的候选位置,以解决 OpenStreetMap(OSM)的复杂性对无技术背景者的可访问性和可用性 - 深度学习在珊瑚礁可扩展语义三维建模中的应用
该研究提出了一种新的方法,通过机器学习和语义分割技术实现了高精度的三维语义地图,从而实现了对珊瑚礁等水下环境的大规模自动分析和监测,降低了劳动力成本,为保护政策提供了更高效的信息。
- BAVS:通过整合基础知识引导音频 - 视觉分割
本文提出了一种基于多模态基础知识的两阶段引导式音频 - 视觉分割框架用于消除分割中的背景噪音或离屏音,通过明确建立音频 - 视觉对应关系和在音频 - 视觉树上追踪校准对象标签的方式,实现了真实音频对象的有效分割。
- 文物映射:多模态语义映射用于物体检测和 3D 定位
提出一个利用多模态传感器融合的方法,能够在一个已知环境中,通过理解该环境搭配环境地图,准确地检测和定位预设物体和障碍物,并相比于单一的传感器能够更准确地检测远处和近处的障碍物。
- 使用潜在先验网络和准平面分割的实时语义映射
提出了一种基于 2D 和 3D SLAM 网络结合的实时语义地图方法,通过重新投影及渲染后进行特征融合,以及一种利用表面法线的几何分割方法来整合 3D 语义元素,并使用新型的神经网络进行轻量级的语义地图后处理,实现了在不同深度感应器方面的性 - 一个物体 SLAM 框架:关联、映射和高级任务
本文提出了一种综合的基于物品的感知和基于物品的机器人任务的物体 SLAM 框架,专注于解决 SLAM 中的数据关联、物体表示和语义地图问题,并通过公开数据集和真实世界结果对其性能进行了评估。
- 上下文中的音频文本检索
本文通过使用音频特征和序列聚合方法来提高音频 - 文本对齐的准确性,并观察到在上下文检索中,语义映射比时间关系重要。结果表明,该系统在所有指标上均显著提高了双向音频文本检索。
- 一种在线语义映射系统,用于扩展与增强视觉 SLAM
本文提出了一种移动视觉系统的实时语义地图构建方法,采用 2D 到 3D 对象检测流程和快速数据关联,将关联检测作为语义约束引入 SLAM 系统进行姿态校正,通过本文提出的观测对象局部关联处理和基于不确定性贪心关联的方案,平均迭代时间达到了 - EMNLPMapRE: 低资源关系抽取的有效语义映射方法
本文提出了一种考虑标签不可知和标签感知语义映射信息的框架,应用于关系提取中的低资源情境下,通过在预训练和微调中的应用,显著提高了模型的性能。
- 语义地图网络:从自我视角构建客观语义地图和表征
本文研究了使用 RGB-D 摄像机生成半自主构建环境场所的含义地图,提出 SemanticMapNet,结合了摄像机几何和神经表示学习,可在自主导览、物品寻找和对环境的问题回答等任务中有更好的表现。
- IJCAI利用多映射和后验映射选择生成多种不同的回复
本文提出了一种用于解决一对多问题的多映射机制, 其中具有多重映射模块的潜在机制用于建模语义映射,同时考虑到了目标响应的选择, 实现了后映射选择的准确优化,并引入了辅助匹配损失以促进 优化。实验结果表明,与现有方法相比,我们的模型在生成多个多 - 高效高阶条件随机场的语义三维占据地图
本文提出了一种基于 CNN 语义分割和 CRF 模型的三维实时地图生成系统,用于精确和大规模的图像语义建模,并在 KITTI 数据集上进行了验证并取得了 10% 的分割准确率提升。
- 单目 SLAM 的半稠密三维语义映射
本论文将最新的深度学习方法与基于视频流的半稠密 SLAM 相结合,在室内 / 室外数据集中得到了更好的 2D 语义标签识别,无需针对序列中的每一帧获得语义分割,其时间复杂度也得以合理控制。