PointRWKV:高效的 Hierarchical Point Cloud Learning 模型
本文提出了一种名为 Receptance Weighted Key Value(RWKV)的新型模型体系结构,它将 Transformer 的并行训练与 RNN 的高效推理相结合,并利用了线性注意机制,使模型既可以被阐释为 Transformer,也可以被阐释为 RNN,从而在训练期间并行计算,并在推理期间保持计算和记忆的复杂度恒定,从而成为第一个可扩展到数十亿参数的非 Transformer 架构,实验表明,RWKV 的表现与同样大小的 Transformer 相当,在序列处理任务中为权衡计算效率和模型性能迈出了重要的一步。
May, 2023
本研究介绍了 Vision-RWKV(VRWKV),这是一种从 NLP 领域的 RWKV 模型中修改而来并针对视觉任务进行了必要的改进的模型,它具有较低的空间聚合复杂性,能够高效处理高分辨率图像,无需窗口操作,并具有与 ViT 相媲美的分类性能,更快的速度和更低的内存使用,从而显示了 VRWKV 作为视觉感知任务的更高效替代品的潜力。
Mar, 2024
本文提出了回顾性接收加权键值(RRWKV)架构,通过将回顾能力融入到 RWKV 中,有效地吸收信息,同时保持存储和计算效率,从而解决了 RWKV 架构的局限性,能够更好地捕捉长程依赖。
Jun, 2023
该论文介绍了一种在图像生成任务中应用于扩散模型的一系列基于 NLP 中 RWKV 模型的架构,通过针对性的修改,使其能在高分辨率图像生成任务中高效处理,减少计算复杂度。在条件和无条件图像生成任务上的实验结果表明,Diffusion-RWKV 在 FID 和 IS 指标上达到或超过现有的 CNN 或基于 Transformer 的扩散模型的性能,同时显著减少总计算 FLOP 使用。
Apr, 2024
通过探索不同的线性注意力架构,设计了一种高效的分割模型 RWKV-SAM,具有最佳的精度和效率。同时,利用多尺度令牌设计了一个高质量的解码器来获取高质量的蒙版,并在各种高质量的分割数据集上训练了一个高效且高质量的模型。在效率和分割质量方面,RWKV-SAM 相对于 Transformer 和其他线性注意力模型表现出色,并超过了最近的视觉模型 Mamba。
Jun, 2024
通过引入一种线性循环神经网络模型到多模态学习任务中,该研究提出了 VisualRWKV,它是首个应用线性 RNN 模型到视觉语言模型中的尝试,并通过数据相关的循环和提示增强建模能力,以及 2D 图像扫描机制来丰富对视觉序列的处理,实验证明 VisualRWKV 在各项基准测试中与基于 Transformer 的模型(如 LLaVA-1.5)相比具有竞争性能。
Jun, 2024
传统的循环神经网络在时间序列任务中曾占据主导地位,但最近在各个时间序列任务中逐渐衰退,因此我们设计了一种高效的基于循环神经网络的时间序列任务模型 RWKV-TS,该模型具有三个独特特点:(一)$O (L)$ 时间复杂度和内存使用的新型循环神经网络架构;(二)相较于传统循环神经网络更好地捕捉长期序列信息的能力;(三)具有高计算效率和有效规模扩展性的特点。通过大量实验,我们的 RWKV-TS 模型与最先进的基于 Transformer 或卷积神经网络模型相比具备竞争力的性能表现,特别值得注意的是 RWKV-TS 不仅性能可比,而且具有较低的延迟和内存使用。RWKV-TS 的成功鼓励了在时间序列领域中进一步探索和创新,其具备竞争性能、低延迟和高效内存使用的特点使其成为未来时间序列任务研究的有希望方向。
Jan, 2024
该论文通过利用规模优势,在点云处理中解决了准确性和效率之间的权衡问题,提出了一种简单高效的 Point Transformer V3 模型,并在多个室内外场景的 20 个下游任务中取得了最先进的结果。
Dec, 2023
本文介绍了一种基于 Fast Point Transformer 的新型轻量级自我关注层的方法,用于对大型 3D 场景进行处理和提高计算效率,并应用于 3D 语义分割和 3D 检测,具有与基于体素的最佳方法相竞争的准确性和比 Point Transformer 更快的推理时间。
Dec, 2021
提出了一种新颖的本地点云几何编码器 VecKM,具有描述性、高效性和鲁棒性。VecKM 利用向量化的核混合来表示本地点云,这种表示具有描述性和鲁棒性,通过两个定理证实了其重构和保持本地形状相似性的能力。此外,VecKM 是首次成功尝试将计算和存储成本从 $O (n^2+nKd)$ 减少到 $O (nd)$ 的编码器,牺牲了边际的常数因子,其中 $n$ 是点云的大小,$K$ 是邻域大小。在法线估计任务中,与现有的流行编码器相比,VecKM 不仅推断速度快 100 倍,而且具有最强的描述性和鲁棒性。在分类和分割任务中,将 VecKM 集成为预处理模块,始终比 PointNet、PointNet++ 和点变换器基线表现更好,并且运行速度始终快 10 倍。
Apr, 2024