- NTIRE 2021 深度引导图像重新照明挑战赛
本文主要介绍了 NTIRE 2021 深度引导图像重照明挑战,分别根据图像的深度信息完成了一对一的图像重照明和任意到任意的图像重照明,最后给出了该挑战的方法和结果。
- CloudAAE: 基于点云的在线数据合成学习 6D 物体姿态回归
本文介绍一种基于深度信息和点云表示的六维物体姿态回归系统,通过轻量级的数据合成流程为训练生成合成点云,而非昂贵的颜色图像合成。文中证明该系统在 LineMOD、LineMOD Occlusion 和 YCB Video 数据集上的有效性。
- 基于深度引导自适应元融合网络的少样本视频识别
通过使用深度信息作为场景的载体,并使用多个非严格对应的深度片段合成新的实例,以及提出了一种新颖的深度引导自适应实例标准化 (DGAdaIN) 融合模块,本文提出了一种自适应元融合网络,用于解决少样本视频识别的问题。
- 级联图神经网络用于 RGB-D 显著物体检测
本文主要介绍了如何运用 Cascade Graph Neural Networks 框架,综合利用颜色和深度两种信息源,以达到更好的 RGB-D 显著目标检测性能。通过采用新颖的 Cascade Graph Reasoning 模块,对两种 - ECCV深度蒸馏下的散焦模糊检测
本文提出了一种将深度信息引入到 DBD 任务中,使用知识蒸馏的方法共同学习深度和模糊信息,设计了一个新的 FCN 网络结构,利用选择式接收域块和监督引导注意力块来提高多尺度特征的合并效率,实验证明该方法优于 11 种其他最先进的方法,并且单 - TSDM:基于 SiamRPN ++ 的跟踪器,包含深度修正器和掩码生成器
本文提出了一个名为 TSDM 的 RGB-D 跟踪器,该跟踪器通过使用深度信息提高了目标检测的效果,并在 Princeton Tracking Benchmark 和 Visual Object Tracking Challenge 测试中 - CVPR基于半监督结构先验的 3D 草图感知语义场景补全
本文提出了一种基于几何学的策略来将深度信息与低分辨率体素表示相结合,通过 3D 素描感知特征嵌入编码几何信息并采用半监督先验学习策略来引导占用推理和语义标签的推断,该方案在三个公共基准测试中一致优于现有技术。
- 多模态端到端自主驾驶
本文提出并分析了终端到终端驾驶中,结合 RGB 和深度信息数据的多模态方案,以期提高自动驾驶 AI 模型的性能。通过模拟和条件模仿学习,证明了采用早期融合多模态方案,可以超越采用单模态的性能表现。
- CVPR深度感知视频帧插值
该研究提出了一种通过探索深度信息来明确检测遮挡的视频帧插值方法,其中利用深度感知流投影层来合成中间流动图像,并且通过分类学习来收集周边像素的上下文信息,实现了输入帧、深度图和像素之间的变换以实现帧合成。
- ECCV基于标签聚类和深度信息融合的视觉关系预测
本文探索了一种无监督标签聚类技术的应用,并表明它在人物环境数据集的视觉关系预测准确性上能够实现实质性的改进。本文提出了将相似关系分布模式的目标标签分组,并将其归入较少的类别。通过标签聚类,不仅可以缓解大分类空间和类别不平衡问题,还可以增加每 - 基于分支角度网络的端到端驾驶模拟
以新的导航指令和角分支网络为基础,结合分割和深度信息提高自动驾驶性能。
- 双流三维语义场景补全
本文提出一种两流方法,结合深度信息和从 RGB 图像推断出的语义信息,利用 3D CNN 推断出完整的 3D 语义张量进行场景补全,该方法远优于目前的最新技术。
- 基于多约束特征匹配和交叉标签传播的 RGBD 图像共同显著性检测
本文提出了一种基于 RGBD 图像的共同显著性检测模型,它利用深度信息来增强共显性的识别,并利用多约束特征匹配来计算图像间的约束关系,然后采用 Cross Label Propagation(CLP)优化方案在单图和多图间交叉地优化内部和外 - 基于深度的鲁棒性人员再识别
该研究提出了一种基于深度信息的人物重识别方法,利用深度数据提取人体骨架和形状特征,进而提出了一种具有旋转不变性的 Eigen-depth 特征描述符,并通过基于核技术的隐式特征转换方法在缺少深度数据时估算特征。实验结果表明,该方法可以在改善 - 训练卷积神经网络比较图像片段进行立体匹配
本研究基于卷积神经网络为计算视差匹配的成本聚合,并针对 KITTI2012、KITTI2015 和 Middlebury 立体数据集对该方法进行了验证,结果表明其在所有三个数据集上优于其他方法。
- CVPR使用卷积神经网络计算立体匹配成本
该论文通过使用卷积神经网络预测图像之间匹配的好坏,进而计算立体匹配代价,再通过交叉基准代价聚合、半全局匹配和左右一致性检查(LRC)来消除遮挡区域中的错误,从而获得了较低的误差率。该方法在 KITTI 立体数据集上达到了 2.61%的误差率