NuwaTS: 修复每一个不完整时间序列
通过对最近提出的深度学习插补方法进行综合调查,本文首先提出了一种分类法,然后通过强调其优势和局限性对这些方法进行了结构化的审查。同时,我们还进行了实证实验,研究了不同方法并比较了它们对下游任务的改进效果。最后,指出了未来研究多变量时间序列插补的开放问题。
Feb, 2024
通过修改 DataWig 方法,本研究开发了 tsDataWig(时间序列 DataWig),能够直接处理时间变量的值并填补复杂时间序列数据中的缺失值。通过使用模拟和三个不同的复杂实际时间序列数据集,证明了 tsDataWig 在时间序列数据填补方面优于原始 DataWig 和当前最先进的方法,并且由于不需要对数据缺失机制进行强假设,具有广泛的应用前景。该研究为具有数百万样本、高维变量和异构数据类型的挑战性时间序列数据的缺失值填补提供了宝贵的解决方案。
Aug, 2023
本文提出了一个基于神经网络的端到端模型,可以在存在缺失值的时间序列数据上,同时实现预测并融合缺失值,相比现有方法表现出更好的综合性能。
Jun, 2023
这篇论文研究了使用深度神经网络架构解决多元时间序列插补问题。通过利用低秩插补方法的经验和专长,我们为传统的 Transformer 模型添加了三项知识驱动的增强,包括投影时间注意力、全局自适应图卷积和 Fourier 插补损失。这些面向任务的归纳偏置利用了不完整时间序列的内在结构,使得我们的模型适用于多种插补问题。我们通过在包括交通速度、交通流量、太阳能、智能电表和空气质量等异构数据集上进行全面的案例研究来进一步加强其可解释性,并通过有希望的实证结果有力地证明了将低秩属性等时间序列原始特征纳入模型可以大幅促进通用化模型的开发,从而解决广泛的时空插补问题。
Dec, 2023
本研究提出了一种创新的框架 aLLM4TS,用于适应大型语言模型(LLMs)进行时间序列表示学习,并通过将时间序列预测重新构想为自监督的多补丁预测任务,比传统的遮罩和重建方法更有效地捕捉了补丁表示中的时间动态。我们的策略包括两个阶段的训练:(i)在各种时间序列数据集上基于下一个补丁预测进行因果连续预训练阶段,有效地将 LLM 的能力与时间序列数据的复杂性同步;(ii)在目标时间序列环境中进行多补丁预测的微调。我们框架的一个独特要素是基于补丁的解码层,摒弃了先前依赖序列级解码的方法。这种设计直接将各个补丁转换为时间序列,从而显著增强了模型在掌握基于时间补丁的表示方面的能力。aLLM4TS 在多个下游任务中表现出卓越性能,证明了它在提高传递性的时间表示方面的有效性,并在 LLMs 用于时间序列分析的适应性方面取得了重要进展。
Feb, 2024
本文提出了一个新颖的概率框架,用于处理具有缺失值的多变量时间序列数据的分类问题。通过训练两个部分的模型,一个用于缺失值填补的深度生成模型,一个用于分类的分类器,能够有效地建模填补缺失值带来的不确定性,并且利用新的正则化技术解决了合并模型可能产生的无意义填补解的问题,通过在真实世界数据上进行广泛实验,证明了我们方法的有效性。
Aug, 2023
我们提出了一种基于内省的时间序列分析的新架构概念,其中关键是自监督预训练的时间序列表示模型(TSRM),可以在自动化和资源高效的方式下进行定制和微调,以实现特定任务,如预测和插补。我们的架构通过灵活和分层的表示学习过程对抗缺失数据和异常值,能够捕捉和学习给定时间序列类别(如心率数据)的结构、语义和关键模式的本地和全局特征。与现有方法相比,我们的架构提高了插补和预测误差,分别高达 90.34%和 71.54%,同时减少了可训练参数高达 92.43%。
May, 2024
本文提出了一种半监督时间序列插值方法 ST-Impute,该方法基于稀疏自注意力模型并结合上下游任务的标签数据和无标签数据,在时间序列插值质量和下游任务结果上优于现有的监督和非监督方法。
Apr, 2023
时间序列插补是时间序列分析的重要预处理步骤,然而缺乏标准化和全面的基准平台来评估不同设置下的插补性能,因此我们开发了 TSI-Bench,这是第一个利用深度学习技术来进行时间序列插补评估的综合基准套件,通过标准化实验设置并研究领域适用的缺失率和模式对模型性能的影响,它在不同下游任务中展示了其有效性,有潜力在时间序列插补研究和分析中开启未来方向。
Jun, 2024
该研究提出了一种使用隐式神经表示法的时间序列建模方法,能够有效捕捉时间序列的连续性,并提供对处理缺失数据、不规则采样或多个传感器的不对齐观测等常见问题的自然解决方案,并通过实验表明,在预测和填充任务中取得了最先进的性能,能够灵活处理各种具有挑战性的场景。
Jun, 2023