SIGNet: 基于语义实例辅助的无监督三维几何感知
本文提出了 GeoNet,这是一个基于联合无监督学习的框架,可用于从视频中估计单眼深度、光流和 Ego-motion。基于 3D 场景几何关系,由我们的框架以端到端的方式联合学习。实验结果表明,在 KITTI 驾驶数据集中,我们的方法在三个任务中均取得了最先进的成果,优于以前的无监督方法,并与受监督方法相当。
Mar, 2018
通过利用语义标记的图像和通过图像变形获得的无监督信号来联合学习语义分割和深度估计,提出了一种半监督的深度估计方法,结果表明在 KITTI 数据集上超过了单目深度估计的先进方法。
Oct, 2018
本文提出了一种名为 Deep Stereo Geometry Network(DSGN)的方法,它使用可微分的体积表示来检测三维物体,同时学习深度信息和语义线索。该方法为立体基础的三维检测提供了一个简单有效的单阶段管道,具有比以前立体基础的三维检测方法更高的性能,甚至与几种 LiDAR-based 方法在 KITTI 3D 物体检测排行榜上表现相当。
Jan, 2020
给定一个三维扫描的物理对象,CAD-SIGNet 模型通过层间交叉注意力和新的 SGA 模块,能够恢复 CAD 模型的设计历史,并提供多种可能的设计选择,从而实现交互式逆向工程。在公开的 CAD 数据集上进行的实验表明,该方法在完整设计历史恢复和条件自动完成两个方面的效果优于现有的基准模型。
Feb, 2024
本文提出了在无监督单目深度估计中引入跨域语义信息以提高几何表示的新思路,包括度量学习方法和特征融合模块,并在 KITTI 数据集上全面评估,在弱质地区和物体边界的监督限制下,本文提出的方法优于现有技术。
Aug, 2021
本文研究自监督学习中如何直接运用语义结构来指导几何表示的学习,提出了一种新的基于预训练语义分割网络和像素自适应卷积的架构,并使用两阶段训练过程来克服动态对象上的常见语义偏差。结果表明该方法在所有像素、细节和语义类别上都优于现有方法,实现了自监督单目深度预测的最新水平。
Feb, 2020
本文介绍了一种称为元语义学习 (Meta-SeL) 的方法,该方法利用两个输入的 3D 局部点(输入 3D 模型和部分分割标签),提供了一种时间和成本高效、精确的投影模型,用于许多 3D 识别任务。根据结果表明,Meta-SeL 在与其他复杂的最新研究的比较中,表现出了竞争性能。此外,Meta-SeL 对随机洗牌不变性具有弹性,也对平移和抖动噪声有较高的鲁棒性。
May, 2022
本文介绍了一种神经网络深度学习的方法,用于直接从原始的几何数据(如点云和三角形网格)中学习隐式形状表示,并已在表面重建和人形态空间学习等领域取得最先进的成果,使得几何深度学习在真实世界的数据上应用变得更加便利。
Nov, 2019
自监督几何感知(SGP)框架通过联合优化特征描述和几何模型,解决了对应关系匹配的问题,在相机姿态和刚性转换等缺少地面真值标签的情况下展示了其在实际数据集上令人瞩目的优越性能。
Mar, 2021
本研究提出了一种基于样本加权的半监督 3D 点云学习方法,通过双层优化框架估计权重并引入三种正则化技术,提高了模型的稳定性和准确性。实验结果表明该方法在 3D 点云分类和分割任务中具有有效性和可行性。
May, 2022