基于基础的时间序列模型:合成与否?
本文提出了 InfoBoost—— 一种高度灵活的跨领域数据合成框架,具有时间序列表示学习能力。我们开发了一种基于合成数据的方法,能够在无需真实数据的情况下进行模型训练,并超越了使用真实数据进行训练的模型性能。此外,我们训练了一个基于合成数据的通用特征提取器,适用于所有时间序列数据。我们的方法克服了多个来源的干扰,如周期性信号、噪音干扰和超出采样窗口能力的长期特征。通过实验证明,我们的非深度学习合成数据能够使模型实现卓越的重构性能和通用的显性表示提取,而无需真实数据。
Feb, 2024
本文通过利用多个领域的无标签样本,旨在开发一种有效的时间序列基础模型。实验结果表明,与其他方法相比,该提出的预训练方法结合 Transformer 模型在下游分类任务中具有更好的性能。
Oct, 2023
对时间序列进行分析的基础模型的研究和应用,包括从头开始预训练基础模型和适应大型语言基础模型进行时间序列分析的方法,并提供了一种 3E 分析框架和一个领域分类系统来帮助该领域的发展。
May, 2024
这篇研究提出了一种生成单变量时间序列合成样本的新方法,通过使用过采样技术创建合成时间序列观测来改善预测模型的准确性,并在实验中证明了该方法优于全局模型和本地模型,提供了更好的权衡。
Apr, 2024
研究了在受到隐私或可用性限制的环境中,人工合成数据作为机器学习的工具的发展与应用,使用贝叶斯范式来描述学习过程中模型参数的更新,提出了一个基于决策理论的基于贝叶斯合成学习的新方法,比传统方法在不同的监督学习和推理问题中表现更出色。
Nov, 2020
深度学习在时间序列预测方面取得了显著优势,然而在大流行预测领域仍存在挑战,如训练数据不足和模型的可解释性。此文献综述了几种先进的建模技术,并提供了进一步研究的建议。
Jan, 2024
本文探讨了在自然语言处理中合成数据生成的细微差别,重点放在基于模板的问题生成上,并比较了其优点和局限性,最后通过实证评估展示了基于模板的合成数据对现代转换器模型性能的影响。研究结果旨在指导自然语言处理从业者在利用合成数据的潜力上,确保在多种应用中获得最佳模型性能。
Oct, 2023
本文利用一个带限制的优化框架,提出了一套生成方法,包括 “GuidedDiffTime”,用于生成合成的具有现实性的时间序列,相比现有方法更加高效,且无需重新训练,取得了显著的性能提升,并大幅降低了碳足迹。
Jul, 2023