时间序列分类(TSC)一直是数据科学和知识工程中的一项关键且具有挑战性的问题。在过去的二十年里,有关 TSC 的研究受到了广泛关注,并涌现出许多基于相似度度量、区间、形状、字典、深度学习方法或混合集成方法的最新方法。近年来,人们还设计了几种从时间序列中提取无监督信息摘要统计(即特征)的工具。本文通过对 112 个时间序列数据集上进行的超过 10000 次学习实验的结果分析表明,基于特征的方法的性能与当前先进的 TSC 算法一样准确,因此在 TSC 文献中应该得到更多的关注。
Aug, 2023
在经济学及其他预测领域中,现实世界问题过于复杂,难以用单一模型假设一种具体的数据生成过程。两种基于时间序列特征的方法:基于特征的模型选择和基于特征的模型组合,对于预测大量时间序列时,各种方法的预测性能随时间序列的性质发生变化。本章讨论了最先进的基于特征的方法,并参考开源软件实现。
Sep, 2023
提出了一种高效的、可扩展的、基于特征提取和重要性过滤的算法,用于过滤机器学习流水线中具有显著影响的特征,特别适用于预测性维护或生产线优化等任务中的时间序列分类和回归问题,并在模拟随机过程和 UCR 时间序列分类库的二元分类问题中进行了基准测试。
Oct, 2016
本文通过大规模的、基于实证的、定量化的方法,对时间序列分类中的相似度测量方法进行了广泛的评估,提出了更加一致的评估标准和基准措施的建议。
Jan, 2014
本文提出了一种采用新的优化准则的分类算法,该准则考虑了分类错误的成本和等待决策的成本,并尝试通过使用聚类或分类器来减少误判和延迟的影响,实验结果表明,这种方法优于传统的基于经验策略的方法。
May, 2020
我们研究了一种新颖的集成方法,用于处理非稳态和样本有限、特征数量庞大的特征选择问题。通过利用特征之间的相互依赖关系,我们提出的层次结构方法克服了传统特征选择方法和特征重要性评分的局限性,并在合成和实际数据集上展示了可伸缩性和稳定性方面的改进性能。
Oct, 2023
时间序列分类是时间序列挖掘中最重要的任务之一,本论文介绍了一种以效率为主要目标的新方法,通过简化时间序列的表示和考虑部分值的距离度量,实现对大型时间序列数据集的高效分类。实验结果表明,与其他高效方法相比,该方法不仅平均速度快 4 倍,而且在分类准确性上更为优越。
Dec, 2023
该研究提出一种基于两阶段聚类的时间序列聚类新技术,其中使用最小二乘多项式分段过程对每个时间序列进行分段,并将它们映射到相同维度的空间中进行一系列的聚类过程,最终结果很有前途,并在与两种最新方法相比较时显示出性能表现优异。
Oct, 2018
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
Jan, 2024
本文综述了深度学习在时间序列分析和预测领域的主要技术,这些新技术实现了针对时间序列的无监督特征学习,并且取得了不错的应用效果。
Jan, 2017