- SelfVIO:自监督深度单目视觉 - 惯性里程计和深度估计
本文提出了一种基于自适应视觉惯性传感器融合和对抗训练的自监督深度学习方法 (SelfVIO),用于从未标记的单目 RGB 图像序列和惯性测量单元 (IMU) 读数中共同估计 6 自由度自我动作和景深图。该方法在 KITTI、EuRoC 和 - 基于神经网络的单张图像人体深度详细估计
本文提出了一种神经网络来估算单张 RGB 图像中前景人物的详细深度图,其中分离深度图为平滑基础模型和残差细节模型设计出两个分支的网络来回归它们,并利用一种新的网络层将粗深度图和表面法线融合以进一步提高最终结果。
- ICCV人体建模:从单张图像非参数三维人体形状估计
本文提出了一种基于深度图的非参数方法,用于从单个 RGB 图像中估计人体的 3D 形状,并结合对抗训练进行优化,并在真实数据集上进行了验证。
- ICCVSharpNet:单目深度估计中遮挡轮廓的快速准确恢复
本文介绍了 SharpNet,一种用于预测准确的深度图像的方法,该方法对于重构遮挡轮廓尤其关注,通过使用带有相机的合成图像进行训练,其在挡住轮廓方面的准确度实际上优于使用结构光的深度相机获取的真实数据。
- 引导深度图上采样的可变形核网络
通过学习稀疏且空间变异的卷积核,我们提出了一种新的 CNN 体系结构和实现方式(DKN),用于将高分辨率彩色图像转换为相应的低分辨率深度图。我们还提出了 FDKN 的快速版本,它在标准基准测试上明显优于现有方法。
- TAPA-MVS: 无纹理感知 PatchMatch 多视角立体
本文提出了一种基于 PatchMatch 的方法来扩展可靠的深度估计,并根据纹理性质修改 Photo-Consistency 测量标准,同时提出了深度细化步骤,以在保留不连续性的同时填补深度图和法线图中的缝隙。
- 带深度图的单张图像去模糊和相机运动估计
本研究提出了一种利用图像深度信息,共同估计 6 自由度运动(6 DoF)相机运动和去除由于相机运动引起的不均匀模糊的方法,并将其制定为能量最小化问题,该方法能有效地解决相机抖动时的图像模糊问题。
- 光度深度超分辨率
本研究探索了使用光度学技术(阴影形状和非标定光度立体)将 RGB-D 传感器的低分辨率深度图上采样到伴随的 RGB 图像的高分辨率。首先提出了一种有效的单次变分方法,而这依赖于目标的反射率是分段常数。随后,展示了这个依赖特定反射模型的限制可 - 即时重建:使用单视图深度预测器作为先验信息为稀疏地图进行修补
该研究介绍了一种实时图像引导的 inpainting 方法,以有任意尺度和稀疏度的地图作为输入,使用单视角深度预测网络作为虚拟深度传感器生成一个完全密集的深度图像。
- 深度卷积压缩感知在 LiDAR 深度补全中的应用
使用压缩感知和交替方向神经网络技术创建了深度循环自编码器,从稀疏 LiDAR 点集中估计出密集的深度图,并表明此方法在仅使用 1800 个参数的情况下能够优于所有以前发表的结果。
- CVPRV2V-PoseNet:从单深度图中准确预测三维手部和人体姿态的体素到体素预测网络
本文提出了一种基于 3D CNN 的手部和人体姿态估计方法,通过使用立方体栅格并为每个关键点估计每个体素的可能性来将问题转化为体素到体素的预测,并克服了 2D 深度图中的透视畸变和非线性映射等缺点,实现了较高的准确性和实时性
- 基于深度置信度分析和多线索融合的立体图像显著性检测
本研究提出了一种新的立体图像显著性检测方法,该方法通过对深度图进行可靠性测量和深度信息引入图形构建,提出了一种新的基于颜色和深度线索的紧凑性定义来计算紧凑性显著性图,并通过基于深度精化的前景种子选择机制和多个线索对比计算前景显著性图,最后通 - 三维人体姿态估计的整体平面预测到局部体积预测
该论文提出了一种使用深度图进行 3D 人体姿态估计的新方法,并运用平面网络和体积网络等模型,显著提高了模型的准确性和计算效率。
- Hand3D:使用 3D 神经网络进行手部姿态估计
使用新的 3D 神经网络架构,通过深度图到三维体积表示的转化,直接对手的三维姿态进行估计,无需进一步处理。同时通过合成深度图来增加训练数据覆盖率,在公开数据上达到了最优性能。
- ICCV多重 Patch 相似度学习
提出了一种使用卷积神经网络直接对多个图像块进行匹配的方法,从而在计算机视觉中估算场景的深度图。实验表明,与基于成对块相似性的方法相比,该方法具有更好的效果。
- 使用全卷积残差网络进行更深的深度预测
采用残差学习和反 Huber loss,提出了一种全卷积结构的模型,可通过单个 RGB 图像估计场景深度图,优于当前所有深度估计方法,且无需后处理技术,能够实时运行。
- 基于联合卷积神经场的单图像深度预测和内在图像分解
文章提出了一种利用联合 CRF 和卷积神经网络解决单个图像预测深度图和本征图的方法,该方法命名为联合卷积神经场模型 (JCNF),该方法在单图深度估计和本征图分解两个任务上均超越了现有方法。
- 基于深度图像的手部分割技术用于手 - 物体交互
提出了一种用深度图像进行手部分割的方法,采用两阶段的随机决策森林方法检测手并进行分割,该方法在手物互动中获得了较高的精度和短时间处理。
- 卷积网络的单张图像多视角 3D 模型
本文提出了一种卷积网络,可以仅仅基于单张图像预测出物体的 RGB 图和深度图,并将多幅深度图融合成完整点云后可转换成表面网格来对任意视野下的三维物体进行识别。网络通过合成的三维车和椅子模型进行训练,在有杂乱背景并搭配真实车辆图像的情况下,仍 - 深入学习手势姿态估计
本文研究使用卷积神经网络结构,预测手的三维关节位置,并通过引入关节先验和有效利用上下文来提高方案的预测精确性和可靠性,在多个基准测试中都表现出了远胜于现有技术的高精度和较快的计算时间。