RGB-D 视频中的显著目标检测
通过收集新的注释 RGBD 视频 SOD(ViDSOD-100)数据集和提出了一种名为 ATF-Net 的新基线模型,本研究在 RGBD 视频显着目标检测方面取得了更好的性能。
Jun, 2024
本文提出了一种深度敏感的 RGB 特征建模方案,并使用深度几何先验来实现特征增强和背景分心减少。另外,我们还提出了一种自动架构搜索方法来进行 RGB-D 显着对象检测,取得了比现有技术更好的结果。
Mar, 2021
该研究提出了一种名为 RD3D 的深度学习模型,其采用前编码器阶段的预聚合和后解码器阶段的深层特征融合来促进 RGB 和深度流的充分融合,并在 RGB-D 显着目标检测模型方面表现优于 14 种先进模型。
Jan, 2021
该研究提出了一种称为 SPNet 的新框架,它通过探索共享信息和特定性质(如特定性)来受益于 SOD 性能,并采用双模态特定网络和共同学习网络来生成单独的和共享的显着性预测地图,分别。此外,为了捕获丰富的互补多模态信息以提高 SOD 性能,该研究还提出了一种多模态特征聚合(MFA)模块。
Aug, 2021
本文提出了一个名为 cmMS block 的模块,结合了 cross-modality feature modulation、adaptive feature selection 和 saliency-guided position-edge attention,可以逐步整合和完善 RGB-D 显著性检测中的交叉模态补充关系,有效提高了精度表现。
Jul, 2020
本研究提出了一种基于深度学习和无监督学习的 RGB-D 显著目标检测方法,利用基于深度学习的迭代自动伪标签生成和注意力训练策略,无需人工像素级注释即可在无监督场景下提高 RGB-D 显著目标检测的效率和效果,同时也适用于全监督情况下的场景。
May, 2022
提出了一种新颖的深度感知显著目标检测框架,采用多层深度感知规则全面优化 SOD 特征,并将深度信息作为误差加权映射来修正分割过程,该框架在利用 RGB 信息作为输入进行推断时优于现有的 RGB SOD 方法和 RGBD 方法的性能表现,并具有轻量级的实现方式。
May, 2020
提供了一个统一解决 RGB、RGB-D 和 RGB-T 三种数据类型的显著目标检测任务的创新模型框架,并基于此框架提出了一个高速高性能的轻量级 SOD 模型 AiOSOD。
Nov, 2023