OctAttention:面向点云压缩的基于八叉树的大规模上下文模型
本论文提出了一种新颖的深度压缩算法,通过将LiDAR点云编码为八叉树,并设计一种以树结构为基础的条件熵模型,来减少点云数据的储存空间。实验证明该方法在保证重建质量的同时,将比特率降低了10-20%,并在下游3D分割和检测任务中表现突出,非常适用于自驾车等实时应用场景。
May, 2020
本文介绍了一种基于学习的无损压缩方法,可用于静态点云几何图形,基于自适应算术编码。我们的编码器在八叉树和体素编码之间混合操作,即将点云自适应地分区为多分辨率体素块,使用八叉树表示分区。利用深卷积神经网络对体素进行学习和处理,呈现了优越的性能。在Microsoft Voxelized Upper Bodies(MVUB)和MPEG的不同点云数据集上,与最先进的MPEG G-PCC标准相比,平均节省了28%的数据。
Nov, 2020
提出了VoxelContext-Net两阶段深度学习框架,利用体素和八叉树方法对静态和动态点云进行压缩,使用体素环境压缩八叉树结构数据,通过熵编码来压缩非叶节点符号的深度熵模型。
May, 2021
本文提出了一种新型的无损点云压缩算法,采用神经网络来估计体素的编码概率,通过表示为八叉树,以从低分辨率开始,逐层编解码的方式来占据状态,并利用神经网络对占据状态进行建模,具有快速和慢速版本,并在基准数据集上取得了最新成果。
Jun, 2021
本文介绍了一种名为OcTr的基于八叉树的Transformer方法,通过动态构建八叉树从而实现对远距离或/和遮挡物体的有效检测,进一步提出了一种混合位置编码方法以增强前景感知,实验表明OcTr方法在Waymo开放数据集和KITTI数据集上均取得了最新的最佳结果。
Mar, 2023
OctFormer使用基于八叉树的关注机制进行分割和检测,这种关注机制具有高效性和灵活性,且在多个基准测试中表现出优异的性能。
May, 2023
本论文介绍了一个能够处理几何和属性组件的点云压缩框架,利用两个基于坐标的神经网络来隐式表示体素化的点云,通过将空间划分为小的立方体并专注于非空立方体内的体素来重建原始点云的几何和属性组件。实验结果表明,与最新的G-PCC标准中采用的八叉树方法相比,我们提出的方法具有更优越的性能,并且与现有的基于学习的技术相比具有高度的普适性。
May, 2024
提出了一种点云压缩框架,可以同时处理人类视觉和机器视觉任务,并通过使用自适应的八叉树深度级别预测器来控制位速,以提高机器视觉任务的性能,而不影响人类视觉质量。
Jun, 2024
通过引入一种基于注意力机制的子节点数量预测模块,该研究提出了一种增强上下文模型的方法,以提高八叉树上基于概率分布的几何压缩算法的编码效率。
Jul, 2024
通过引入上下文特征残差和多层感知分支,我们提出了一种改进现有上下文模型的通用结构,在点云几何压缩中提高了性能。我们验证了该方法在MPEG 8i、MVUB物体点云数据集以及LiDAR点云数据集SemanticKITTI上对基于八叉树的模型(OctAttention)和基于体素的模型(VoxelDNN)的性能改进。
Jul, 2024