本文提出一种使用伪深度测量的多模态 RGB-D 分类方法,通过多传感器融合方法和最新的域不变单目深度估计技术,克服了单模态 RGB 图像分类易受空间外观变化以及季节、天气、照明等域变化干扰导致精度下降的问题,并通过公共 NCLT 数据集进行跨域场景实验,证明了所提出的分类框架的有效性。
May, 2023
该研究介绍一种基于深度学习的 RGB-D 场景识别方法,提出了一种深度学习模型训练的两步骤方法和一种新的 RGB-D 视频数据集,实现了在 RGB-D 图像 (NYUD2 和 SUN RGB-D) 和视频 (ISIA RGB-D) 场景识别方面的最优表现。
Sep, 2018
本研究利用卷积神经网络和弱监督方法,提出了一种能够在有限深度图像条件下学习具有较强区分性的深度特征,从而实现了 RGB-D 场景识别的最新成果,达到了最好的表现。
Jan, 2018
本文提出了一种新颖的方法,通过学习框架,识别和整合主导的跨模态深度特征,独立计算粗略深度图,并使用置信度损失和多模态融合网络进行端到端的深度估计,从而在各种困难情景中展示了鲁棒的深度估计能力。
Feb, 2024
本文提出了一种有效的编码器 - 解码器模型和基于注意力的融合模块,以集成 RGB-Depth 图像的特征,从而提高语义分割的精度和计算效率。实验结果表明,该模型在计算成本和模型大小方面大大超越了现有的最先进模型,并且在准确性方面具有良好的性能。
Dec, 2019
本文提出一种新的深度自编码器共享特定特征分解网络,将多模态信号分解成一系列组件,进而结合特征结构提出了一种结构化稀疏学习机以获得更好的分类性能,实验证明该方法在动作识别方面最先进。
Mar, 2016
使用卷积神经网络,采用 RGB-D 架构,通过两个不同模式的 CNN 处理流程结合延迟融合网络来识别物体,同时引入多阶段训练方法以及进行数据增强方案,使得处理 RGB-D 图像更加健壮,同时在真实嘈杂环境中取得了最先进的识别结果。
Jul, 2015
本文对多模态 3D 场景理解的最新进展进行了系统调查,介绍了各种多模态任务的背景和困难,分类了现有方法,并对它们的优势和限制进行了探索,提供了在几个基准数据集上的对比结果和深入分析,最后讨论了未解决的问题并提出未来研究的几个潜在方向。
Oct, 2023
该论文介绍了两种方法来利用多通道输入和无监督域自适应算法来提高机器人对真实图片的语义分割结果,其中一种是基于深度图像的融合方法,另一种是基于深度图像的多任务学习方法,并创建了相应的基准测试。
Dec, 2018
本文提出了一个使用 RGB-D 图像进行对象和场景识别的新方法,使用深度神经网络取代手工特征提取器,并利用卷积神经网络提取的视觉特征和递归神经网络高效转换为高级别特征,通过软投票方法进行多模态融合来实现一致的分类结果,实验结果表明该方法在对象和场景识别任务中均取得了卓越或同等水平的性能。
Apr, 2020