基于基础的时间序列模型：合成与否？

Mar, 2024

基于基础的时间序列模型：合成与否？

Towards Foundation Time Series Model: To Synthesize Or Not To Synthesize?

Kseniia Kuvshinova, Olga Tsymboi, Alina Kostromina, Dmitry Simakov, Elizaveta Kovtun

TL;DR该研究通过实验证明，在正常时间序列情况下，仅使用真实时间序列的数量有限的训练数据，相较于使用更多的合成数据进行训练，利用监督框架进行训练可以获得更好的结果。

Abstract

The industry is rich in cases when we are required to make forecasting for large amounts of time series at once. However, we might be in a situation where we can not afford to train a separate model for each of them. Such issue in →

forecasting time series modeling foundation model synthetic data real-life examples

发现论文，激发创造

合成时间序列数据真的不如真实数据好吗？

本文提出了 InfoBoost—— 一种高度灵活的跨领域数据合成框架，具有时间序列表示学习能力。我们开发了一种基于合成数据的方法，能够在无需真实数据的情况下进行模型训练，并超越了使用真实数据进行训练的模型性能。此外，我们训练了一个基于合成数据的通用特征提取器，适用于所有时间序列数据。我们的方法克服了多个来源的干扰，如周期性信号、噪音干扰和超出采样窗口能力的长期特征。通过实验证明，我们的非深度学习合成数据能够使模型实现卓越的重构性能和通用的显性表示提取，而无需真实数据。

Feb, 2024

面向时间序列数据的基础模型

本文通过利用多个领域的无标签样本，旨在开发一种有效的时间序列基础模型。实验结果表明，与其他方法相比，该提出的预训练方法结合 Transformer 模型在下游分类任务中具有更好的性能。

Oct, 2023

时间序列基础模型综述：利用大型语言模型进行时间序列表示的泛化

对时间序列进行分析的基础模型的研究和应用，包括从头开始预训练基础模型和适应大型语言基础模型进行时间序列分析的方法，并提供了一种 3E 分析框架和一个领域分类系统来帮助该领域的发展。

May, 2024

时间序列数据增强的不平衡学习问题

这篇研究提出了一种生成单变量时间序列合成样本的新方法，通过使用过采样技术创建合成时间序列观测来改善预测模型的准确性，并在实验中证明了该方法优于全局模型和本地模型，提供了更好的权衡。

Apr, 2024

基于合成数据的贝叶斯学习基础

研究了在受到隐私或可用性限制的环境中，人工合成数据作为机器学习的工具的发展与应用，使用贝叶斯范式来描述学习过程中模型参数的更新，提出了一个基于决策理论的基于贝叶斯合成学习的新方法，比传统方法在不同的监督学习和推理问题中表现更出色。

Nov, 2020

深度学习和基础模型在时间序列预测中的调查

深度学习在时间序列预测方面取得了显著优势，然而在大流行预测领域仍存在挑战，如训练数据不足和模型的可解释性。此文献综述了几种先进的建模技术，并提供了进一步研究的建议。

Jan, 2024

时间序列的序列到序列建模基础

本论文提供了第一个对基于序列到序列模型进行时间序列预测的理论分析，比较了这种方法与传统时间序列模型之间的区别，为实践者在不同建模方法中做出量化指导。

May, 2018

合成数据是否使得大型语言模型更高效？

本文探讨了在自然语言处理中合成数据生成的细微差别，重点放在基于模板的问题生成上，并比较了其优点和局限性，最后通过实证评估展示了基于模板的合成数据对现代转换器模型性能的影响。研究结果旨在指导自然语言处理从业者在利用合成数据的潜力上，确保在多种应用中获得最佳模型性能。

Oct, 2023

关于有限时间序列生成问题的研究

本文利用一个带限制的优化框架，提出了一套生成方法，包括 “GuidedDiffTime”，用于生成合成的具有现实性的时间序列，相比现有方法更加高效，且无需重新训练，取得了显著的性能提升，并大幅降低了碳足迹。

Jul, 2023

基于时间序列分析的基础模型：教程与综述

时间序列分析基于 FMs 的模型设计范式的最新进展，强调其理论基础、发展的最新步伐和未来研究探索的途径。

Mar, 2024