本研究介绍了 Rfd-Net,该方法通过在原始点云数据中直接检测和重构密集对象表面,摆脱了使用常规网格表示场景的限制,旨在预测可识别高对象性的形状,从而实现全局对象定位和局部形状预测,提高了物体检测的精度,比现有技术研究结果提高了 11 个三维网格交并比。
Nov, 2020
在标签有限的情况下,本文提出了一种通用而简单的框架来解决点云理解问题,利用传统和学习到的 3D 描述符进行方法比较,并提出了基于亲和性的学习区域合并策略,该方法在各种实验设置下优于现有方法,无需复杂的学习策略。
Dec, 2023
本文提出了一种使用基于网格的表示来捕捉三维重构任务中的细粒度几何信息的学习框架,它使用自由形变和稀疏线性组合的紧凑网格表示来重建三维物体,相比之前的工作,我们不依赖于轮廓和标记来进行三维重建,并在合成和真实数据集上进行了很有前途的实验结果验证。
Nov, 2017
提出了一种端到端的解决方案,通过从单个图像中重建室内场景布局,物体包围盒和网格来解决室内场景的语义重建问题,实验证明该方法在室内布局估计,三维物体检测和网格重建方面的表现优于现有方法。
Feb, 2020
针对 3D 点云的分割问题,我们提出了一种新的点云分割框架,该框架能有效地优化整个场景的像素级特征,几何结构和全局上下文先验。实验结果表明,该方法优于现有的一些最先进的方法,并探讨了在三维重建场景中合成相机姿态以获得更高的性能。
Aug, 2019
该研究提出了一种基于深度学习的点云重建网络,采用两个阶段进行密集化、去噪和点云完整性重建,其中使用了变换器进行离散体素向 3D 点的转换,同时提出了放大位置编码模块以优化变换器,实现在 3D 扫描建模领域的最新水平。
Nov, 2021
本文介绍了一种在有限标签情况下解决点云理解问题的通用简单框架,通过无监督区域扩展的聚类方法生成聚类,并结合地理特征相似性和语义特征相似性在弱标签监督下学习合并过度细分的聚类,以及自监督重建和数据增强优化模块引导标签在场景中语义相似点之间的传播。实验证明,该框架在大规模 3D 语义场景解析的数据效率设置下,在语义分割、实例分割和目标检测等三个重要弱监督点云理解任务中表现最佳,所开发技术还具有对机器人操作和自主导航中的下游任务提供更好表示的潜力。代码和模型可在链接处公开获取。
我们提出了一种新颖的分离的物体中心 Transformer(DOCTR)方法,通过探索以物体为中心的表示来实现多个子任务的统一学习,包括对象分割、姿态估计和网格重建。通过将每个对象表示为一个查询,并使用 Transformer 解码器来优化涉及它们关系的所有查询,我们的方法在具有多个对象的多个子任务上取得了最先进的性能。
Mar, 2024
提出了一种从无结构点云中重建网格的新框架,通过利用虚拟视图中三维点的可见性和基于传统图割的网格生成。与其他基于学习的方法相比,该方法只在二维二分类任务上进行学习,更加普适和实用。实验表明,在小型复杂物体上,该方法具有良好的可传递性和鲁棒性,并与最先进的学习方法相比具有竞争优势,并且在大型室内和室外场景中表现出色。
Aug, 2021
本文提出一种无监督学习方法,通过观察未标记的多视角视频,学习将一个包含多种物体的复杂场景的单幅图像观察映射到一个三维神经场景表示,可以将该表示分解为可移动和不可移动的部分,并通过神经渲染进行自监督训练,从而实现基于对象的三维表示、新视角合成、实例分割和三维边界框预测等多种下游任务,并通过对象操作(如删除、插入和刚体运动)实现场景编辑。
Jul, 2022