Feb, 2024

合成时间序列数据真的不如真实数据好吗?

TL;DR本文提出了 InfoBoost—— 一种高度灵活的跨领域数据合成框架,具有时间序列表示学习能力。我们开发了一种基于合成数据的方法,能够在无需真实数据的情况下进行模型训练,并超越了使用真实数据进行训练的模型性能。此外,我们训练了一个基于合成数据的通用特征提取器,适用于所有时间序列数据。我们的方法克服了多个来源的干扰,如周期性信号、噪音干扰和超出采样窗口能力的长期特征。通过实验证明,我们的非深度学习合成数据能够使模型实现卓越的重构性能和通用的显性表示提取,而无需真实数据。