用于时间序列分类的规范区间森林(CIF)分类器
本文提出一种时间序列分类的树集成方法——时间序列森林 (TSF),采用 Entrance gain 准则计算熵增益和距离度量,同时提出了一种用于捕捉时间序列分类中重要时序特征的“时间重要性曲线”,在简单特征下性能超过了一些竞争对手如动态时间扭曲进行最近邻分类器,并且具有线性计算复杂度和基于并行计算技术。
Feb, 2013
本文介绍 Proximity Forest 算法,通过随机化选择实例和相似度度量,从包含数百万个时间序列的数据集中学习准确的模型,并在毫秒内对时间序列进行分类。该算法在时间序列分类方面表现出极高的准确性和速度,并在对 1M 个时间序列的地球观测数据集进行实验时表现出优越性能。
Aug, 2018
通过系统比较卓越时间序列特征库中的时间序列的适当特征化表示形式,可以捕捉时间序列的动态特性,为时间序列应用程序提供高效的聚类和分类能力。我们通过减少时间序列特征的数量,从和特性库中的原始数量的 4791 种特征中提取出一个名为 catch22 的定义良好、准确有效并不冗余的时间序列特征集,这个集合只包含有 22 个时间序列特征。这种降维数据的方法可以在保持准确性的情况下大大减轻计算负担,并通过让科学、工业、金融和医学应用程序可以使用一种可解释性的时间序列特征语言,从而促进其应用。
Jan, 2019
TS-CHIEF是一种新的TSC算法,它构建了一个集成了最有效的时间序列嵌入式森林的集成分类器,通过使用树形分类器进行高效的分类。我们对加利福尼亚大学河滨(UCR)档案的85个数据集进行了评估,在可扩展性和效率方面实现了最新的准确性,能够在仅用比其它算法更短的时间内处理130k的时间序列。
Jun, 2019
介绍了 HIVE-COTE 2.0,是一种用于时间序列分类的元集成算法,包括多个分类器的集合,其中包括相位无关的 shapelets,基于词袋的字典以及相位相关的区间;通过替换现有成员,引入了两个新的分类器 TDE 和 DrCIF 以及 ROCKET 分类器的集成 Arsenal,并在 UCR 库和 UEA 库的数据集上展示了 HIVE-COTE 2.0 的显着性能优于现有技术水平。
Apr, 2021
提出了一种新的基于相似度的分类器Proximity Forest 2.0,它通过采用包括计算上更高效的计算相似度方法、新的弹性相似度度量ADTW以及成本函数调优等多种技术,将UCR测试集上的表现超过以往同类型分类器,并在某些需要相似度方法处理的测试集上,甚至超过了其他各类方法。
Apr, 2023
本研究提出了两个新的时间序列外生回归算法FreshPRINCE和DrCIF,以及展示了它们与InceptionTime一起显著优于其他已测试的18个回归算法,尤其是这两种方法是唯一显著优于标准旋转森林回归算法的方法。
May, 2023
使用一个特征类型(分位数),固定区间和现成分类器,我们展示了在标准基准数据集上可以实现与现有时间序列分类间隔方法相同的平均准确度。这种间隔方法的提炼在UCR档案的142个数据集上取得了最先进的准确度,并且只需不到15分钟的总计算时间(训练和推理)使用单个CPU核心。
Aug, 2023
时间序列分类(TSC)一直是数据科学和知识工程中的一项关键且具有挑战性的问题。在过去的二十年里,有关TSC的研究受到了广泛关注,并涌现出许多基于相似度度量、区间、形状、字典、深度学习方法或混合集成方法的最新方法。近年来,人们还设计了几种从时间序列中提取无监督信息摘要统计(即特征)的工具。本文通过对112个时间序列数据集上进行的超过10000次学习实验的结果分析表明,基于特征的方法的性能与当前先进的TSC算法一样准确,因此在TSC文献中应该得到更多的关注。
Aug, 2023
本研究解决了分段时间序列分类中,因不同类别持续时间不同(MVD)导致的上下文依赖性问题,现有模型未能有效处理这一挑战。我们提出了一种新颖的一致性学习框架Con4m,利用MVD的上下文先验进行分类,显著提升了对连续分段的区分能力,并改善了边界标签不一致的问题。实验结果表明Con4m在多个数据集上表现优异。
Jul, 2024