- Eidos: 高效、微不可见的对抗 3D 点云
该研究论文阐述了针对 3D 点云的机器学习分类任务中存在的对抗攻击问题,并提出了 Eidos 框架,该框架支持高效的难以察觉的对抗攻击方法,通过迭代的两步骤流程,能够找到最佳的对抗性示例,从而平衡运行效率和对抗攻击的察觉程度。研究实验证明, - VoxAtnNet: 面部展示攻击的通用三维点云卷积神经网络
提出了一种基于 3D 点云的新型演示攻击检测算法 VoxAtnNet,用于侦测手机上的面部演示攻击。通过处理 3D 点云获取体素化的方式,以保留空间结构,然后使用新型卷积注意力网络对体素化的 3D 样本进行训练,实验结果表明该方法在检测已知 - VBR:罗马视觉基准测试
本文介绍了一份在罗马收集的视觉和感知研究数据集,包括 RGB 数据、3D 点云、IMU 和 GPS 数据,并引入了一个新的基准用于视觉里程计和 SLAM,以推进自主机器人和计算机视觉的研究。
- 基于点云的工业系统三维缺陷检测与分类的进展:综述
对基于深度学习处理三维点云的工业应用中的缺陷形状分类和分割的最新进展进行全面综述,旨在为产业系统中剩余寿命的理解和提升做出贡献。
- 基于 CUDA 的稀疏卷积在 GPU 上的三维点云优化
近年来,深度学习方法的利用显著增加,尤其是卷积神经网络(CNNs),已成为涉及结构化网格数据的各个领域,如图片分析和处理中的主要方法。然而,在许多领域中,激光雷达和 3D 传感器的指数增长导致了对 3D 点云分析的增加需求。与照片不同,点云 - 可扩展的超点图聚类三维全景分割
介绍了一种高效的方法,通过将大型 3D 点云的全景分割任务重新定义为可扩展的图聚类问题来进行。该方法可以仅使用本地辅助任务进行训练,从而在训练过程中消除了资源密集型的实例匹配步骤。此外,我们的方法可以轻松适应 superpoint 范例,进 - UFO: 三维点云中的未知前景物体检测
提出了一个针对 3D 点云中未知前景对象(UFO)检测的新问题,该问题是野外自动驾驶中至关重要的技术。通过建立一个包括评估协议、方法论和基准的新的 UFO 检测框架,解决了现有 3D 对象检测器在 3D 定位和超出分布(OOD)检测方面遇到 - 快速训练极端掩码的扩散变压器用于三维点云生成
FastDiT-3D is a novel masked diffusion transformer designed for efficient generation of high-quality 3D point clouds, ac - 激活频率和 ViT 用于 3D 点云质量评估无需参考
基于深度学习的质量评估在感知多媒体质量评估方面取得了显著的提升,然而对于 3D 点云等 3D 视觉数据仍处于初级阶段。因此,我们提出了一种给定 3D 点云的无参考质量度量方法,通过集成频率幅度作为空间降解模式的指标来评估由压缩引起的质量影响 - 基于新颖类别发现和基础模型的三维语义分割
这篇论文介绍了点云数据的一种新任务 NCD 的语义分割方法,通过在线聚类、不确定性估计和语义蒸馏提出了一种新的 NCD 方法,并提出了一种新的评估协议来严格评估其在点云语义分割中的性能,通过在多个数据集上进行全面评估,证明了该方法相对于其他 - 覆铺天堂:通过将真实世界因素纳入考虑的成本效益高且可扩展的 LiDAR 仿真
通过集合 “背景” 和 “物体” 数据集,Paved2Paradise 方法可生成全标注、多样化和逼真的激光雷达数据集,并且只需进行最少人工注释,从而在成本高昂的情况下加速点云模型的开发。
- Minuet:在 GPU 上加速 3D 稀疏卷积
Minuet 是一种专为现代 GPU 设计的内存高效的稀疏卷积引擎,通过使用新型的分段排序双遍历二分搜索算法、轻量级方案进行瓦片大小自动调优以及高效的 GEMM 分组方法,显著提高了点云网络执行效率并在多个方面取得了超过以往模型的性能提升。
- OneFormer3D:统一点云分割的一种 Transformer
本文提出了一种统一、简单、有效的模型 OneFormer3D,利用可学习的卷积核同时处理实例分割和语义分割,通过输入统一的实例和语义查询来训练,并在 ScanNet 测试排行榜中取得了第一名和新的最佳性能,同时在 ScanNet、ScanN - GRJointNET:3D 不完整点云的协同完成和部分分割
GRJointNet 是一个能够在不完整的 3D 点云上实现点云补全和分割的深度学习框架,能够显著提高自主系统中点云的实用性和效能。
- 点云自监督学习:基于三维到多视角遮蔽自编码器
通过使用 3D 到多视图掩码自编码器,充分利用 3D 点云的多模属性,提出了一种全新的方法,这不仅丰富了模型对几何结构的理解,还利用了点云的固有多模性能,有效地改进了各种任务,包括 3D 对象分类、少样本学习、部分分割和 3D 对象检测。
- 基于 RGB-D 数据的工业异常检测双支路重构网络
基于 RGB-D 输入,我们提出了一种轻量级的双分支重建网络 (DBRN),通过学习正常和异常样本之间的决策边界,使用深度图而不是点云输入来消除两种模态之间的对齐要求,并引入了一个重要性评分模块来辅助融合这两种模态的特征,从而在 MVTec - 3D-QAE:全量子三维点云的完全自编码
该论文介绍了首个用于三维点云的量子自动编码器,通过在模拟的基于门的量子硬件上进行实验,证明了该方法优于简单的经典基准模型,为三维计算机视觉领域开辟了新的研究方向。
- CVPR面向无监督的基于 LiDAR 点云的物体检测
我们研究在自动驾驶场景中从 3D 点云中进行无监督对象检测的问题,提出了一种简单而有效的方法,利用点聚类、时间一致性、CNN 的平移等性质以及自我监督来改进无监督检测算法,通过在非相近区域进行自动标记扩展到远距离,从而实现了零 - shot - NeuralGF: 通过学习神经梯度函数进行无监督点法线估计
通过引入一种新的神经梯度函数学习范式,我们提出了一种从点云中直接估计定向法线的新方法,它能够更准确地学习未定向和定向法线估计任务。
- ImageManip: 图像基于机器人操作的可支配性导向下一视角选择
基于图像的机器人操纵系统,利用多个视角捕捉目标物体,推断深度信息以补充其几何信息,采用几何一致性融合视角,实现精确操纵决策。