LinK: 基于激光雷达的三维感知的线性核
本文提出了一种高效且有效的大规模稀疏 3D 神经网络(LSK3DNet),利用动态修剪扩大 3D 卷积的尺寸,通过空间动态稀疏和通道权重选择的核心组件,实现了对大规模稀疏 3D 核的学习,提升性能的同时大幅减少模型大小和计算成本,取得了语义 KITTI 上的最新性能。
Mar, 2024
本文提出空间分割卷积及其大卷积核模块来解决直接应用大卷积核在 3D CNNs 中遇到的困难,大卷积核 3D CNN 网络可以用于语义分割和物体检测,取得了较高的性能,说明大卷积核在 3D 视觉任务中是可行并且必不可少的。
Jun, 2022
该研究提出了一种基于 2D 透视范围图像的卷积神经网络架构方法,可用于直接从范围图像视图学习 3D 表示。通过利用本地几何和跨模态融合处理,该方法在行人检测方面的 AP 从 69.7%提高到 75.5%,同时模型参数和操作速度均表现良好。
Jun, 2021
该论文提出了一种利用 3D 卷积网络进行 LiDAR 语义分割、全景分割和 3D 检测的新框架,其中采用了柱状分割和非对称 3D 卷积网络来探索 3D 几何模式,该模型在 SemanticKITTI,nuScenes 和 A2D2 上的结果均表现出最先进的性能并在分割和检测任务中显示出很好的泛化性能。
Sep, 2021
该论文提出了一种新的框架,使用圆柱形分区和不对称 3D 卷积网络来探索 3D 几何模式,并引入点智能精炼模块以减轻损失体素标签编码的干扰;测试表明,该方法在 SemanticKITTI 和 nuScenes 数据集上超过现有方法,排名第一并且较现有方法提高了约 4%。
Nov, 2020
我们提出了四种用于设计大核卷积神经网络的架构指南,并发现大核对于拓展卷积神经网络在非视觉领域具有卓越表现的关键因素。我们的模型在图像识别、时间序列预测和音频识别任务中表现出卓越性能,优于其他竞争模型,并且无需对体系结构进行特定模态的定制化处理。
Nov, 2023
我们提出了一种利用经典核表示法的新方法,通过解决线性系统来实现对密集激光雷达点的高效处理,在各种分布场景下具有出色的实时性能和竞争性能,适用于大规模激光雷达数据的高效场景流估计。
Mar, 2024
通过稀疏跨尺度注意力网络,结合全局体素编码注意力捕捉实例上下文的长距离关系,以提高过分割大型对象的回归精度,并采用实例中心的稀疏无类表示来处理面积聚合点,实现稀疏卷积以减少网络计算量。在 SemanticKITTI 数据集上,我们的方法在 3D LiDAR 全景分割任务中取得了很大进展,以实时推理速度获得了第一名。
Jan, 2022
该研究提出一种新的方法,利用适合扫描模式的坐标系来分析自动驾驶中 LiDAR 传感器所获取到的 3D 数据,并引入了基于范围的卷积方法,其能够根据自我车辆与物体的距离和物体的比例来调整感受野。实验结果在 nuscenes 竞赛上表现良好,可以与现有的先进架构相媲美,而该架构也可以轻松地整合到其他管道中。
Dec, 2020
Hierarchical transformers have introduced the DLK and DFF modules in the D-Net architecture, resulting in improved performance for medical image segmentation tasks.
Mar, 2024