- CVPR偏振引导融合调节的鲁棒深度增强
本研究利用偏振成像提高不准确的深度传感器测量,通过学习策略和神经网络预估深度图,采用 Polarization Prompt Fusion Tuning(PPFT)策略优化 RGB 模型性能,并在公开数据集上验证了优于现有深度增强方法的实验 - 增强型三维人脸识别的深度图去噪网络和轻量级融合网络
基于深度传感器的三维人脸识别(3D FR)随着其可用性的增加而引起越来越多的关注,本文介绍了一种创新的基于去噪隐式图像函数的深度图去噪网络(DMDNet),以减少噪声并增强低质量的三维人脸深度图像的质量。在使用 DMDNet 生成清晰深度面 - 基于特征的位姿估计中的深度图像和点云转换
通过消除噪音并将深度数据转换为图像,本文提出了一种新方法,可以显示传统深度图像中隐藏的空间细节,从而在深度数据和经典计算机视觉之间架起了桥梁,并在可视航位推测和 RGB-D SLAM 任务中取得了更好的结果。
- 基于 RBF 权重的 RGB-D 物体检测超插深卷积
通过使用深度传感器的增强现实设备,我们提出了一种实时的 RGB-D 物体检测模型,其中包括深度引导的超卷积和基于上采样的可训练融合层,提高了从原始深度图中提取深度和彩色图像特征的效率和性能,并在 NYU Depth v2 数据集上表现优于其 - 基于 RGB 的类别级物体姿态估计与解耦的度量尺度恢复
本文提出了一种新颖的流程,通过解耦 6D 姿态和尺寸估计,减轻了单目观察带来的尺度不精确对刚性变换的影响,并借助预训练的单目估计器获取局部几何信息,以便搜寻二维 - 三维对应关系,并利用基于类别级统计的独立分支直接恢复物体的度量尺度,最后倡 - 基于深度无监督 RGB2Depth 适应的隐私支持下的跌倒检测
我们提出了一种隐私保护的解决方案,通过在训练过程中利用标记的 RGB 数据和未标记的深度数据,实现了跨模态的跌倒检测。我们的方法在无监督的 RGB 到深度领域适应任务中取得了最先进的结果。
- 利用飞行时间传感器和深度学习进行高通量和准确的牛体三维扫描
我们引入了一种高吞吐量的 3D 扫描解决方案,专为精确测量牛的表型而设计。这款扫描仪利用一组深度传感器,即飞行时间(ToF)传感器,每个传感器都由专用嵌入式设备控制。该系统在生成高保真的 3D 点云方面表现出色,从而便于在使用过程中准确地重 - TransNet:透明物体操作通过类别级别姿态估计
通过使用局部深度完成和表面法线估计,本文提出了一种名为 TransNet 的两阶段管道,用于估计透明物体的类别级姿势,该方法在大规模透明物体数据集上进行了评估,并与现有的类别级姿势估计方法进行了比较。比较结果表明,TransNet 在透明物 - 无源域适应方法在 RGB-D 语义分割中的应用:基于 Vision Transformers
研究基于深度传感器的多模态框架和基于视觉变换器的源自由语义分割的深度感知方法,通过混合特征和深度信息以及深度基础熵最小化方法,能够提高分割效果。
- TransNet: 透明物体类别级别的姿态估计
TransNet 是一种使用局部深度补全和表面法向量估计技术来实现透明物体类别级位姿估计的两阶段管道,能够比同类别级位姿估计方法更好的提高位姿估计的准确性。
- SensatUrban:从城市规模摄影测量点云中学习语义
本文介绍 SensatUrban 数据集,由近三十亿个带有精细语义注释的点云数据集组成,用于评估最先进的分割算法性能,并分析了限制城市规模点云理解的关键挑战。
- EagerMOT:通过传感器融合实现的三维多物体跟踪
本文介绍了一种新的多目标跟踪方法 EagerMOT,它使用深度传感器和相机来融合对目标的观察,以实现对移动机器人周围物体在三维空间和时间上的定位,实验表明 EagerMOT 方法在 KITTI 和 NuScenes 数据集上达到了先进水平。
- SurfelWarp: 高效的非体积化单视角动态重建
我们提出了一种基于 surfel-based geometry 的密集 SLAM 系统,该系统可以实时重建非刚性变形场景,不需要模板或先前的模型。
- MM使用深度姿态组合的深度图人体姿势估计
本文通过使用深度学习方法,针对三维深度图像进行建模,提出了一种名为 Deep Depth Pose 的模型,用于估计人体骨骼关节的三维位置,并在 ITOP 和 UBC3V 数据集上达到了最新的最优效果。
- CVPR基于图卷积自编码器的可变形形状补全
本论文提出一种新的深度学习方法,利用可变自编码器和图形卷积运算来实现对非刚性变形物体进行局部补全,对合成和真实扫描的人体和面部网格进行了实验,显示出有前途的结果。
- ICCV主动式 3D 建图学习
本文提出了一种基于深度传感器的主动 3D 映射方法,不仅可以学习从稀疏的深度测量中重建稠密的 3D 占据地图,还可以优化深度测量光线的反应控制,该方法通过一种快速且有效的优化算法实现。实验结果表明,基于稀疏测量学习重建的方法与深度测量光线优 - VConv-DAE:无需物体标签的深度体积形状学习
通过提出一种新的全卷积体积自动编码器,有效实现了从嘈杂的 3D 数据中提取体积表示,并在噪声去除和形状完成等多个任务上超越了以往的技术,同时在分类和形状插值方面也得到了不错的结果。
- 基于深度的手部姿态估计:方法、数据和挑战
手势姿态估计方面已有巨大进展,但在处理复杂场景,特别是手与周围物体交互的情况下仍存在困难。此研究提出了一个具有挑战性的新数据集,并定义了一个一致的评估标准,同时引入了一个简单有效的最近邻基线系统,加以比较,结果表明相当一部分系统无法在训练集 - ECCV自我中心 RGB-D 图像中的 3D 手势姿态检测
本文提出一种基于深度传感器的、具有先验的手势识别系统,使用包含自我场景的光辉合成模型来生成训练数据,并在真实环境下进行测试。结果表明,该方法在单目 RGB-D 图像中的手部检测和姿态估计方面均具有最先进的性能。
- 使用深度神经网络对动作捕捉序列进行分类和可视化
本研究提出了一种基于深度神经网络的姿态识别系统,使用相对关节位置、时间差和规范化运动轨迹等简单但有效的特征对骨架数据进行特征提取,并采用深度自编码器对特征进行可视化,测试结果表明,该深度神经网络能够捕获到比主成分分析更具有区分性的信息,同时