- CAPT: 使用 Transformer 从单个点云中进行类别级别的关节估计
通过使用 Transformer 基于类别级别的点云进行关节参数估计,本文提出了 CAPT 方法。CAPT 方法利用端到端的 Transformer 架构对单个点云中的关节参数和状态进行估计,能够准确地估计各种关节物体的关节参数和状态,并通 - GS-CLIP: 从真实世界数据进行对比度语言 - 图像 - 3D 预训练的高斯飞溅
提出 GS-CLIP 方法将 3D 高斯粒化引入多模态预训练,以增强 3D 表示,并通过预训练的视觉 - 语言模型和 3D 编码器对 3D 高斯粒化进行优化,实现全局显式特征的提取和融合。实验证明,GS-CLIP 显著提高了最新研究成果,超 - 利用合成数据仅仅从历史素描重建灰泥雕像的概念
利用以前的红色草图重新构建状态,我们提出了一种完全自动化的方法来重建点云,并通过生成彩色图像、深度图和表面法线来展示初步结果,而无需使用其他相似的样本集。
- 一种用于分布归一化的 Lennard-Jones 层
引入 Lennard-Jones 层进行密度均衡,通过对点进行系统重新排列来保持它们的整体结构,并将其应用于点云的重分布和生成过程中,最终证明其对点云生成和去噪网络的改进是有效的。
- 点云的重要性:重新思考不同观测空间对机器人学习的影响
通过在 17 个不同的接触丰富的操作任务上进行广泛实验证明,针对机器人学习中的不同观察空间,特别是 RGB、RGB-D 和点云,点云方法在性能上通常超过 RGB 和 RGB-D,不论是从头开始训练还是利用预训练。此外,研究结果表明,点云观察 - AAAI点云部分编辑:分割、生成、组装和选择
提出了一种基于四阶段过程(分割、生成、组装和选择)的点云部分编辑模型 SGAS,通过特征解缠和约束策略,实现了编辑部分的多样性、忠实度和结果质量的提高。在不同数据集上进行的实验验证了 SGAS 在点云部分编辑上的高效性和有效性,同时还可以用 - 基于点云强化学习的主动搜索和覆盖
这篇研究论文介绍了一种使用端到端的深度强化学习解决方案来优化移动 3D 传感器的轨迹,以便在整体场景中找到特定的物体并被点云覆盖,实现尽快的目标搜索和覆盖。
- AAAI通过点特征增强掩膜自编码器实现紧凑 3D 表示
为了学习紧凑的 3D 表示,我们提出了一个简单而有效的 Point Feature Enhancement Masked Autoencoders (Point-FEMAE),它主要由一个全局分支和一个局部分支组成,通过全局随机和局部块掩码 - 非所有面都平等:半监督 3D 目标检测的定位不确定性估计
用于半监督三维物体检测的侧面感知框架,通过三个关键设计(三维边界框参数化方法、不确定性估计模块和伪标签选择策略)共同工作,显式地估计每个侧面的定位质量并在训练阶段分配不同级别的重要性,实验证明这种方法能在不同场景和评估指标下始终优于基准模型 - PointJEM: 通过联合熵最大化来减少特征冗余的自监督点云理解
PointJEM 是一种自我监督表示学习方法,通过最大化不同部分之间的联合熵,减少点云领域嵌入特征的冗余信息,实现学习到的特征变量成对独立,从而显著减少特征的冗余,并在分类和分割等下游任务中取得了有竞争力的性能。
- PointMoment:基于混合矩的自监督表示学习 3D 点云
PointMoment 是一种用于点云自监督表示学习的新框架,它利用高阶混合矩损失函数而不是传统的对比损失函数,计算特征变量的高阶混合矩并强制其分解为各自矩的乘积,从而使多个变量更加独立并最小化特征的冗余。该方法还结合了对比学习方法,用于最 - 基于 LiDAR 的自动驾驶验证中的路缘检测
本论文介绍了一种从 LiDAR 传感器捕获的一系列点云中检测三维路缘的方法,该方法包括两个主要步骤:利用分割深度神经网络在每次扫描中检测路缘;然后,利用车辆的里程计数据在重建的点云中估计三维路缘。通过实验证实了该方法的有效性并验证了其可以显 - 使用扩散模型进行点云预训练
通过提出一种新的预训练方法 PointDif,本文在点云领域实现了显著的改进,包括基于条件点生成器的生成复原的点云和利用全局几何先验和物体全局点密度分布来捕捉局部和全局特征,从而在分类、分割和检测等多个下游任务中取得了实质性的提升。
- 提高通用性的隐式形状网络的鲁棒性:可调的非参数模型
通过将网络的形状间数据先验与 Nyström 内部形状正则化先验相结合,在测试时提出了一种有效的机制来解决一些限制。通过使用综合内插核来适应当前形状的超参数,得到的形状函数在形状特定的再生核希尔伯特空间中具有稳定性和高效性,并提供形状自适应 - 混合去噪通用占据网络
通过使用 MLPs 对局部特征进行编码,以点云来恢复 3D 重建的模型,通过引导去噪的相对位置编码,从点云中汇集附近的特征,预测空间中的任意查询点的占用概率,并夺得了卷积方法的最新成果,并且只使用了一半的模型参数。
- VET: 点云补全和高质量神经渲染的视觉误差层析
利用神经渲染和点云代理几何体,通过可填补缺陷的深度图像纠正视图合成中的问题,提高渲染质量和时间稳定性。
- 基于语义渲染的 LiDAR 点云预训练
我们提出了一种新颖的图像辅助预训练框架 PRED,用于户外点云,以解决点云不完整性和遮挡对齐的问题,并通过神经渲染技术利用图像的语义信息进行监督。大规模数据集上的实验证明了 PRED 方法在 3D 感知任务中的显著优势。
- 基于深度学习的三维点云分类:系统调查与展望
该论文介绍了点云的获取、特点和挑战,回顾了点云分类的 3D 数据表示、存储格式和常用数据集,总结了基于深度学习的点云分类方法,并对最新研究进展进行了补充,对主要方法的性能进行了比较和分析,并讨论了点云分类面临的一些挑战和未来方向。
- LISNeRF 绘图:基于语义神经场的大规模三维场景基于 LiDAR 的隐式绘图
本文提出了一种通过 LiDAR 测量单独重建大规模三维语义场景的新方法,使用隐式表示进行建模。通过浅层多层感知机(MLPs)从隐式特征解码出语义信息和有符号距离值,并采用自监督策略和伪监督策略进行隐式特征和 MLPs 参数的联合优化,最后利 - 大规模场景神经表示的点扩散隐式函数
通过学习场景的表面分布、减小可采样空间并采用 Point Diffusion implicit Function (PDF) 方法,实现了大规模场景的神经表示,其中包括利用扩散模块将稀疏点云转化为密集点云作为先验,并通过基于 Mip-NeR