OctAttention:面向点云压缩的基于八叉树的大规模上下文模型
提出了 VoxelContext-Net 两阶段深度学习框架,利用体素和八叉树方法对静态和动态点云进行压缩,使用体素环境压缩八叉树结构数据,通过熵编码来压缩非叶节点符号的深度熵模型。
May, 2021
本文介绍了一种基于学习的无损压缩方法,可用于静态点云几何图形,基于自适应算术编码。我们的编码器在八叉树和体素编码之间混合操作,即将点云自适应地分区为多分辨率体素块,使用八叉树表示分区。利用深卷积神经网络对体素进行学习和处理,呈现了优越的性能。在 Microsoft Voxelized Upper Bodies(MVUB)和 MPEG 的不同点云数据集上,与最先进的 MPEG G-PCC 标准相比,平均节省了 28%的数据。
Nov, 2020
OctFormer 使用基于八叉树的关注机制进行分割和检测,这种关注机制具有高效性和灵活性,且在多个基准测试中表现出优异的性能。
May, 2023
本文提出了一种新型的无损点云压缩算法,采用神经网络来估计体素的编码概率,通过表示为八叉树,以从低分辨率开始,逐层编解码的方式来占据状态,并利用神经网络对占据状态进行建模,具有快速和慢速版本,并在基准数据集上取得了最新成果。
Jun, 2021
本论文提出了一种新颖的深度压缩算法,通过将 LiDAR 点云编码为八叉树,并设计一种以树结构为基础的条件熵模型,来减少点云数据的储存空间。实验证明该方法在保证重建质量的同时,将比特率降低了 10-20%,并在下游 3D 分割和检测任务中表现突出,非常适用于自驾车等实时应用场景。
May, 2020
提出了一种点云压缩框架,可以同时处理人类视觉和机器视觉任务,并通过使用自适应的八叉树深度级别预测器来控制位速,以提高机器视觉任务的性能,而不影响人类视觉质量。
Jun, 2024
本研究提出了一种点关注网络,它可以在对 3D 点云进行语义分割时学习丰富的本地形状特征和上下文相关性,并代替传统卷积核或参数共享机制来更有效地处理稀疏的 3D 点云。实验表明,该算法能够与现有的最先进方法同等或更好地处理各种 3D 点云。
Sep, 2019
本研究提出了两种三维物体检测的自我注意力模型,即通过将卷积特征与自我注意力特征相结合,将成对的自我注意力机制纳入最新的基于 BEV、体素和点云检测器,最终在 KITTI 验证集上证明了模型精度的一致提高,同时减少了运算量和计算成本,实现了更好的参数效率和计算效率。
Jan, 2021
本文提出了一种基于 k-d 树的方法,旨在同时利用点云的局部和全局背景信息,通过沿树结构逐步学习表征向量,从而生成区分度强的点集特征。实验证明,该方法在 3D 场景语义分割等任务上明显优于现有的方法。
Nov, 2017
使用集合转换器在分层框架中对点云进行形状分类和分割,实现了状态 - of-the-art 的性能,并可用于处理大规模稀疏数据。
Jul, 2022