多维时间序列预测的随机投影层
本文研究线性模型在时间序列预测中的能力,提出了一个基于多层感知机的模型 TSMixer,通过在时间和特征维度上的混合操作提取信息。TSMixer 在常见的学术基准测试中表现出和专业模型类似的性能,在真实世界的 M5 基准测试数据集上表现出比先进模型更好的性能。本文的结果强调了有效利用交叉变量和辅助信息以提高时间序列预测性能的重要性,并且预计 TSMixer 的设计范例会为基于深度学习的时间序列预测开启新的视野。
Mar, 2023
TSMixer 是一个轻量级的神经架构,由多层感知机模块组成,旨在为补丁时间序列提供高效的替代转换器。通过添加在线对账头,混合通道建模和简单的门控关注机制等组件,TSMixer 的学习能力得到显著提高。TSMixer 在预测方面的性能优于现有的 MLP 和 Transformer 模型,同时可显著减少存储器和运行时间。
Jun, 2023
本文研究了多层感知机,重点探究了其深化效果和改进方法。其中提出了 MLP-Mixer 与宽 MLP 具有稀疏权重的相关性,并从预测性能优化的角度进行了实验验证。
Jun, 2023
利用多尺度混合的方法进行时间序列预测,通过提取微观和宏观信息来解决复杂的时间变化,并通过 Past-Decomposable-Mixing (PDM) 和 Future-Multipredictor-Mixing (FMM) 块实现全面的多尺度系列的预测,同时在长期和短期预测任务中取得了一致的最先进性能,并具有良好的运行时效率。
May, 2024
提出了一种名为 MSD-Mixer 的多尺度分解 MLP-Mixer 模型,该模型通过学习将时间序列分解成不同的组成部分,并在不同层级上表示这些组成部分,以处理多尺度时间模式和通道间的依赖关系。通过在各种实际数据集上进行广泛实验,包括长期和短期预测、插补、异常检测和分类等五个常见时间序列分析任务,证明了 MSD-Mixer 在性能上明显优于其他最先进的任务通用和任务特定方法。
Oct, 2023
交通预测是一种典型的时空数据挖掘任务,对公共交通系统具有重要意义。为了实现高效、轻量和有效的时空预测方法,我们提出了一种直观而新颖的框架 MLPST,它是一个纯多层感知器架构,能够在要求仅为线性计算复杂度的同时,很好地捕捉空间和时间依赖关系。通过与先进基准模型的比较,广泛的实验证实了 MLPST 的出色效果和高效性,而在模型的准确率最优中,MLPST 实现了最好的时间和空间效率。
Sep, 2023
本文提出了一种基于多层感知器 (MLP) 的架构,MLP-Mixer,它不需要使用卷积和注意力机制,包含两种类型的层,一种将 MLP 应用于图像补丁,一种将 MLP 应用于补丁之间的位置信息,具有与现代 CNN 和 Transformer 相媲美的预训练和推理成本,希望鼓励更多超越 CNN 和 Transformer 的研究。
May, 2021
该研究提出了一种时序预测模型,MPR-Net,通过卷积和反卷积操作,适应性地分解多尺度历史序列,并基于模式复制的先前知识构建了模式扩展预测方法,由于利用了时间依赖性,MPR-Net 不仅实现了线性时间复杂度,而且使预测过程可解释。该模型在短期和长期预测任务的十多个真实数据集上进行了充分实验,表现出最先进的预测性能以及良好的泛化性和鲁棒性能。
Jul, 2023
通过引入一种新颖的 CNN 模型 ——PatchMixer,我们解决了 Transformer 模型在时间序列预测任务中面临的挑战,该模型具有可以保留时间信息的排列不变自注意力机制。与传统 CNN 不同的是,我们的方法仅依赖于深度可分离卷积,可以在单一尺度的结构中提取局部特征和全局相关性。试验结果表明,与现有最先进的方法和表现最佳的 CNN 相比,PatchMixer 相对提升了分别为 3.9%和 21.2%,而且速度是最先进方法的 2-3 倍。我们将发布我们的代码和模型。
Oct, 2023
本文提出了 MotionMixer,这是一种高效的三维人体姿势预测模型,完全基于多层感知器。通过顺序混合两种模态,MotionMixer 学习了空间 - 时间三维身体姿势之间的依赖关系。通过使用 squeeze-and-excitation (SE) 块来校准姿势序列中每个时间步的影响,我们在 Human3.6M、AMASS 和 3DPW 数据集上使用标准评估协议评估了我们的方法,并展示了最先进的性能。
Jul, 2022