基于季节调整的特征选择方法:大规模搜索引擎日志
本研究使用在线搜索频率的时间序列来洞察多个国家的 COVID-19 盛行情况,并开发了基于联合王国国家卫生服务和公共卫生英格兰公共卫生实验室识别的相关症状类别的无监督建模技术。结果表明,基于在线搜索的模型比由报道的确诊病例和死亡事件组成的做出了更早的预测,并证明了在线搜索数据可以用来开发补充公共卫生监测方法,以帮助应对 COVID-19。
Mar, 2020
研究以无实际训练数据为基础,利用基于特征的时间序列分类方法准确预测疾病爆发和非爆发。通过对合成数据和真实数据集的测试,发现在爆发发生之前可以通过统计特征和早期预警信号指示器区分爆发和非爆发序列。
Apr, 2024
本研究使用机器学习方法,结合多种数据源包括谷歌搜索、社交媒体数据和卫生部门数据等,提供实时和预测性的美国流感活动估计。通过将每个数据源产生的流感样病例(ILI)活动情况独立生成的多个估计值结合起来,使用机器学习集成方法生成准确的每周 ILI 预测,为 CDC ILI 报告发布前的四周提供预测。结果证明,将不同数据源(包括社交媒体和众包数据)纳入流感预测可以获得极大的洞见。
Aug, 2015
本文利用时间序列预测技术对匈牙利的水痘病例进行模拟预测,演示 LSTM 模型在县级预测方面的表现优于其他模型,SARIMAX 模型在国家级预测方面的表现最佳。同时,我们的数据预处理方法的表现也优于传统的数据预处理方法。
Sep, 2022
基于顺序广义变分模态解耦和空间平滑长短期记忆神经网络的市场销售量时间序列预测方法能够提高市场销售量的预测准确性和对特定市场情境的准确性。
Jun, 2024
本文提出了一种训练分类器来选择 ETS 模型组件形式的方法,以更高效地选出适当的模型,并在 M4 预测竞赛数据集和医院月度数据集上进行了实证研究。
Jun, 2022
我们研究了一种新颖的集成方法,用于处理非稳态和样本有限、特征数量庞大的特征选择问题。通过利用特征之间的相互依赖关系,我们提出的层次结构方法克服了传统特征选择方法和特征重要性评分的局限性,并在合成和实际数据集上展示了可伸缩性和稳定性方面的改进性能。
Oct, 2023
在经济学及其他预测领域中,现实世界问题过于复杂,难以用单一模型假设一种具体的数据生成过程。两种基于时间序列特征的方法:基于特征的模型选择和基于特征的模型组合,对于预测大量时间序列时,各种方法的预测性能随时间序列的性质发生变化。本章讨论了最先进的基于特征的方法,并参考开源软件实现。
Sep, 2023