Sep, 2023

利用随机分割函数生成层次结构,提升时间序列分类效果

TL;DR本研究介绍了一种新颖的带有随机分割函数的层次分割聚类方法,通过层次分类(HC)增强多类数据集中的分类性能。该方法具有在不需要显式信息的情况下生成层次结构的独特能力,适用于缺乏先验层次知识的数据集。通过根据分类器的可辨识性将类别系统地分成两个子集,所提出的方法构建了层次类别的二叉树表示。在 46 个多类时间序列数据集上使用流行的分类器(svm 和 rocket)和 SSFs(potr、srtr 和 lsoo)对该方法进行了评估。结果显示,当使用 rocket 和 svm 作为分类器时,该方法在约一半和三分之一的数据集上显著提高了分类性能。研究还探讨了数据集特征与 HC 性能之间的关系。尽管类别数量和平坦分类(FC)评分显示了一致的显著性,但在不同的分割函数上观察到了变化。总体而言,该方法为增强多类时间序列数据集中的分类性能提供了一种有希望的策略。未来的研究方向涉及探索不同的分割函数、分类器和层次结构,以及将该方法应用于超越时间序列数据的不同领域。源代码已公开提供,以促进复现和进一步探索该方法。