时间序列数据的表示方法和距离度量的实验比较
介紹了 PATTERN REPRESENTATION COMPARISON IN SERIES (PRCIS),一種長時間序列的距離度量方法,可利用近期對時間序列用字典縮略的進展,展示其對多種任務和數據集的實用性。
Dec, 2022
一种高度比较,基于特征的时间序列分类方法,利用广泛的算法数据库从时间序列中提取数千个可解释的特征,并采用贪心前向特征选择与线性分类器选择最具信息的特征进行分类,实现了对时序列的降维并超越了传统的基于实例的分类器。
Jan, 2014
本篇论文介绍了针对时间序列数据异常检测的分类方法,并对传统和深度学习技术进行了评估和比较,为选择最适合特定应用设置的方法提供了指导,并提出了研究方向。
Sep, 2022
本文介绍了一种使用分布式内核来表示轨迹和测量其相似度的简单而强大的方法,该方法解决了轨迹测量的两个主要不足之处,并在异常检测,子轨迹异常检测和轨迹模式挖掘等任务中表现出卓越的性能。
Jan, 2023
本文提供一个综合性的比较不同无监督学习方法在图像特征表达方面的表现,使用线性评估、最近邻分类和聚类等多个基准测试来定量比较,分析了不同嵌入度量的均匀性、容忍性和中心内核对齐,并提出了两个新的度量。通过比较分析发现不能以单一流行的方法来代表整个领域的研究,在未来的工作中,应考虑如何利用这些方法的互补性。同时提供了一个统一的框架来定量数据增强不变性,并提醒不同任务需要的增强不变性类型各有差异。
Jun, 2022
本文提出了一个将文本数据匹配到更高、更有比较性的结果中去的框架,并成功开发出一个预估模型可以精确预估最佳匹配结果的数值,以此提高了在媒体偏见和医学干预研究中使用文本匹配以改进因果推断的准确性。
Jan, 2018
测量时间序列数据之间的距离或相似性是许多应用的基本方面,包括分类和聚类。我们的目标是开发一种可以查找相似时间点附近发生的相似趋势,并且对应用领域的研究人员易于解释的度量。我们提出了一种新颖的度量方法 DTW+S,它创建了一个可解释的时间序列 “接近保持” 矩阵表示,每一列代表局部趋势,然后应用动态时间规整来计算这些矩阵之间的距离。我们提供了支持该表示选择的理论分析。我们证明了 DTW+S 在集成构建和流行病曲线聚类中的实用性。此外,我们还证明了相对于动态时间规整在某类数据集上的分类效果更好,特别是当局部趋势而非尺度起决定性作用时。
Sep, 2023