May, 2024
MAMBA4D: 高效的长序列点云视频理解及解耦空间-时间状态空间模型
MAMBA4D: Efficient Long-Sequence Point Cloud Video Understanding with
Disentangled Spatial-Temporal State Space Models
TL;DR基于最近提出的状态空间模型(SSMs)的新型4D点云视频理解骨干网络,通过解开原始4D序列中的空间和时间,使用新开发的Intra-frame Spatial Mamba和Inter-frame Temporal Mamba模块建立了点云视频内部和帧间的时空关联,并在人体动作识别和4D语义分割任务上证明了该方法的优越性。