NuwaTS: 修复每一个不完整时间序列

May, 2024

NuwaTS: 修复每一个不完整时间序列

NuwaTS: Mending Every Incomplete Time Series

Jinguo Cheng, Chunwei Yang, Wanlin Cai, Yuxuan Liang, Yuankai Wu

TL;DR利用 NuwaTS 框架将预训练语言模型（PLM）重新用于普通时间序列插补任务，通过设定特定嵌入来捕捉不完整时间序列的信息，提出对比学习方法以增强模型对不同遗漏模式的适应性，训练得到一对多的插补模型，并证明其在各种数据集和遗漏模式上胜过现有的特定领域模型。

Abstract

time series imputation plays a crucial role in various real-world systems and has been extensively explored. Models for time series imputation often require specialization, necessitating distinct designs for diff

time series imputation pre-trained language model missing patterns contrastive learning approach domain-specific models

发现论文，激发创造

多元时间序列插补的深度学习：综述

通过对最近提出的深度学习插补方法进行综合调查，本文首先提出了一种分类法，然后通过强调其优势和局限性对这些方法进行了结构化的审查。同时，我们还进行了实证实验，研究了不同方法并比较了它们对下游任务的改进效果。最后，指出了未来研究多变量时间序列插补的开放问题。

Feb, 2024

基于神经网络的时间序列数据中缺失值填补方法的开发 —— 数据 Wig 再利用

通过修改 DataWig 方法，本研究开发了 tsDataWig（时间序列 DataWig），能够直接处理时间变量的值并填补复杂时间序列数据中的缺失值。通过使用模拟和三个不同的复杂实际时间序列数据集，证明了 tsDataWig 在时间序列数据填补方面优于原始 DataWig 和当前最先进的方法，并且由于不需要对数据缺失机制进行强假设，具有广泛的应用前景。该研究为具有数百万样本、高维变量和异构数据类型的挑战性时间序列数据的缺失值填补提供了宝贵的解决方案。

Aug, 2023

一种端到端的时间序列模型，用于同时进行填充和预测

本文提出了一个基于神经网络的端到端模型，可以在存在缺失值的时间序列数据上，同时实现预测并融合缺失值，相比现有方法表现出更好的综合性能。

Jun, 2023

ImputeFormer: 用于可推广的时空插补的图变换器

这篇论文研究了使用深度神经网络架构解决多元时间序列插补问题。通过利用低秩插补方法的经验和专长，我们为传统的 Transformer 模型添加了三项知识驱动的增强，包括投影时间注意力、全局自适应图卷积和 Fourier 插补损失。这些面向任务的归纳偏置利用了不完整时间序列的内在结构，使得我们的模型适用于多种插补问题。我们通过在包括交通速度、交通流量、太阳能、智能电表和空气质量等异构数据集上进行全面的案例研究来进一步加强其可解释性，并通过有希望的实证结果有力地证明了将低秩属性等时间序列原始特征纳入模型可以大幅促进通用化模型的开发，从而解决广泛的时空插补问题。

Dec, 2023

多区块预测：适应时序表示学习的 LLM 调整

本研究提出了一种创新的框架 aLLM4TS，用于适应大型语言模型（LLMs）进行时间序列表示学习，并通过将时间序列预测重新构想为自监督的多补丁预测任务，比传统的遮罩和重建方法更有效地捕捉了补丁表示中的时间动态。我们的策略包括两个阶段的训练：（i）在各种时间序列数据集上基于下一个补丁预测进行因果连续预训练阶段，有效地将 LLM 的能力与时间序列数据的复杂性同步；（ii）在目标时间序列环境中进行多补丁预测的微调。我们框架的一个独特要素是基于补丁的解码层，摒弃了先前依赖序列级解码的方法。这种设计直接将各个补丁转换为时间序列，从而显著增强了模型在掌握基于时间补丁的表示方面的能力。aLLM4TS 在多个下游任务中表现出卓越性能，证明了它在提高传递性的时间表示方面的有效性，并在 LLMs 用于时间序列分析的适应性方面取得了重要进展。

Feb, 2024

时间序列分类中的概率性数据补全

本文提出了一个新颖的概率框架，用于处理具有缺失值的多变量时间序列数据的分类问题。通过训练两个部分的模型，一个用于缺失值填补的深度生成模型，一个用于分类的分类器，能够有效地建模填补缺失值带来的不确定性，并且利用新的正则化技术解决了合并模型可能产生的无意义填补解的问题，通过在真实世界数据上进行广泛实验，证明了我们方法的有效性。

Aug, 2023

时间序列表示模型

我们提出了一种基于内省的时间序列分析的新架构概念，其中关键是自监督预训练的时间序列表示模型（TSRM），可以在自动化和资源高效的方式下进行定制和微调，以实现特定任务，如预测和插补。我们的架构通过灵活和分层的表示学习过程对抗缺失数据和异常值，能够捕捉和学习给定时间序列类别（如心率数据）的结构、语义和关键模式的本地和全局特征。与现有方法相比，我们的架构提高了插补和预测误差，分别高达 90.34％和 71.54％，同时减少了可训练参数高达 92.43％。

May, 2024

使用半监督学习进行时间序列插值：填补丢失数据的空缺

本文提出了一种半监督时间序列插值方法 ST-Impute，该方法基于稀疏自注意力模型并结合上下游任务的标签数据和无标签数据，在时间序列插值质量和下游任务结果上优于现有的监督和非监督方法。

Apr, 2023

TSI-Bench: 时间序列插值基准测试

时间序列插补是时间序列分析的重要预处理步骤，然而缺乏标准化和全面的基准平台来评估不同设置下的插补性能，因此我们开发了 TSI-Bench，这是第一个利用深度学习技术来进行时间序列插补评估的综合基准套件，通过标准化实验设置并研究领域适用的缺失率和模式对模型性能的影响，它在不同下游任务中展示了其有效性，有潜力在时间序列插补研究和分析中开启未来方向。

Jun, 2024

基于隐式神经表示的时间序列连续建模：插值与预测

该研究提出了一种使用隐式神经表示法的时间序列建模方法，能够有效捕捉时间序列的连续性，并提供对处理缺失数据、不规则采样或多个传感器的不对齐观测等常见问题的自然解决方案，并通过实验表明，在预测和填充任务中取得了最先进的性能，能够灵活处理各种具有挑战性的场景。

Jun, 2023