SpoT-Mamba:在时空图上学习长距离依赖关系与选择状态空间
基于选择性状态空间模型,该研究提出了一种名为 STG-Mamba 的时空图学习方法,借助图选择性状态空间块(GS3B)刻画了 STG 网络的动态演化,并引入了 Kalman 滤波图神经网络(KFGN)来提升 GNN 在 STG 数据建模中的能力。大量实证研究表明了 STG-Mamba 在预测性能和计算效率方面的优越性。
Mar, 2024
本研究介绍了 Graph-Mamba,通过将 Mamba block 与依赖于输入的节点选择机制进行整合,增强了图网络中的长程上下文建模,从而显著提高了预测性能。通过对十个基准数据集的广泛实验,证明 Graph-Mamba 在长程图预测任务中胜过最先进的方法,且在 FLOPs 和 GPU 内存消耗方面计算成本只占一小部分。
Feb, 2024
准确高效的交通预测对智能交通系统的规划、管理和控制至关重要。本文介绍了一种创新的交通流预测方法,即空间 - 时间选择性状态空间模型(ST-SSMs),采用了创新的 ST-Mamba 块,可以在较少的计算成本下实现良好的预测准确性。通过对多样化的真实数据集进行严格测试,ST-SSMs 模型在预测准确性和计算简易性方面呈现出异常的改进,为交通流预测领域树立了新的基准。
Apr, 2024
这项研究介绍了 ST-MambaSync,它是一个创新的框架,将一个简化的状态空间层与一个流线型的注意力层集成在一起,在处理高维数据(如空间 - 时间数据集)时,它在空间 - 时间预测任务中实现了竞争性的准确率。我们深入研究了注意机制与 Mamba 组件之间的关系,揭示了 Mamba 在残差网络结构中起到类似于注意力的功能。这种对比分析支持了状态空间模型的高效性,阐明了它们在降低计算成本的同时能够提供卓越的性能。
Apr, 2024
在这篇论文中,我们提出了一种混合框架 Mambaformer,该框架在内部结合了 Mamba 和 Transformer 架构,用于长短范围的时间序列预测,并通过比较研究表明,Mambaformer 系列可以在长短范围的时间序列预测问题中胜过 Mamba 和 Transformer。
Apr, 2024
提出了一个通用的时空数据建模、分析和预测框架,重点关注空间和时间都稀疏的数据。该框架由自激励点过程和图结构循环神经网络两个组成部分无缝耦合,并实现了更精准的实时预测,针对犯罪和交通预测具有良好的效果。
Apr, 2018
我们提出了一种异构图曼巴网络 (HGMN),它是利用选择性状态空间模型 (SSSMs) 进行异构图学习的首次探索。相比文献,我们的 HGMN 克服了两个主要挑战:(i) 捕捉异构节点之间的长程依赖和 (ii) 将 SSSMs 针对异构图数据进行适应。我们的主要贡献是提出了一个通用的图结构,可以解决现实场景中的异构节点,并进行高效的流程。在方法上,我们引入了一种两级高效的标记化方法,首先在相同节点类型内捕捉长程依赖,然后在所有节点类型之间进行捕捉。在实证方面,我们在异构基准测试上将我们的框架与其他 19 个最先进的方法进行了比较。广泛的比较表明,我们的框架在准确性和效率维度上表现优于其他方法。
May, 2024
提出了一种名为 Bi-Mamba4TS 的双向 Mamba 模型,通过采用补丁技术丰富了局部信息并精细捕捉时间序列的演化模式,同时结合数据集特征选择更合适的建模方法,实验证明该模型在七个真实数据集上相较于现有方法获得了更准确的预测结果。
Apr, 2024
通过选择性的状态空间模型为基础,我们提出了一种新的 GNN 类别,即图 Mamba 网络,并在理论上证明了它的能力,并且实验证明尽管计算成本大大降低,但在长距离、小规模、大规模和异源基准数据集中,GMN 表现出色。
Feb, 2024
序列建模是跨多个领域的一个关键领域,包括自然语言处理、语音识别、时间序列预测、音乐生成和生物信息学。历史上,循环神经网络(RNNs)和长短时记忆网络(LSTMs)在机器翻译、命名实体识别等序列建模任务中占主导地位,但转换器的进步改变了这一范式,因为其性能更优越。然而,转换器面临 O (N^2) 注意力复杂度和处理归纳偏差的挑战。各种改进方法已被提出来应对这些问题,其中使用频谱网络或卷积在一些任务上表现良好,但仍然难以处理长序列。状态空间模型(SSMs)已经成为此背景下序列建模范式的有希望的可替代选择,特别是随着 S4 及其变种(如 S4nd、Hippo、Hyena、Diagnol State Spaces(DSS)、Gated State Spaces(GSS)、Linear Recurrent Unit(LRU)、Liquid-S4、Mamba 等)的出现。本综述将基于门控结构、结构体系和循环结构对基础 SSMs 进行分类,还重点介绍了 SSMs 在视觉、视频、音频、语音、语言(特别是长序列建模)、医疗(包括基因组学)、化学(如药物设计)、推荐系统和时间序列分析等领域的不同应用。此外,我们总结了 SSMs 在长序列竞技场(LRA)、WikiText、Glue、Pile、ImageNet、Kinetics-400、sstv2 以及早餐、硬币、LVU 等各种时间序列数据集上的性能。有关 Mamba-360 工作的项目页面可在此网页上找到:https://github.com/badripatro/mamba360。
Apr, 2024