时间序列数据的表示方法和距离度量的实验比较

Dec, 2010

时间序列数据的表示方法和距离度量的实验比较

Experimental Comparison of Representation Methods and Distance Measures for Time Series Data

Xiaoyue Wang, Hui Ding, Goce Trajcevski, Peter Scheuermann, Eamonn Keogh

TL;DR本文通过广泛的实验研究，比较了不同的时间序列数据表示法和相似度度量方法的有效性，对现有的成果进行了统一的验证，并揭示了文献中某些主张可能过于乐观的情况。

Abstract

The previous decade has brought a remarkable increase of the interest in applications that deal with querying and mining of time series data. Many of the research efforts in this context have focused on introducing new representation methods for →

time series data similarity measures dimensionality reduction experimental study comparative findings

发现论文，激发创造

时间序列分类相似度度量的实证评估

本文通过大规模的、基于实证的、定量化的方法，对时间序列分类中的相似度测量方法进行了广泛的评估，提出了更加一致的评估标准和基准措施的建议。

Jan, 2014

Matrix Profile XXVII：一种新的长时间序列比较距离度量

介紹了 PATTERN REPRESENTATION COMPARISON IN SERIES (PRCIS)，一種長時間序列的距離度量方法，可利用近期對時間序列用字典縮略的進展，展示其對多種任務和數據集的實用性。

Dec, 2022

基于特征的高度比较时间序列分类

一种高度比较，基于特征的时间序列分类方法，利用广泛的算法数据库从时间序列中提取数千个可解释的特征，并采用贪心前向特征选择与线性分类器选择最具信息的特征进行分类，实现了对时序列的降维并超越了传统的基于实例的分类器。

Jan, 2014

时序无监督异常检测的比较研究：实验与分析

本篇论文介绍了针对时间序列数据异常检测的分类方法，并对传统和深度学习技术进行了评估和比较，为选择最适合特定应用设置的方法提供了指导，并提出了研究方向。

Sep, 2022

一种形式上健壮的时间序列距离度量

本文提出了一种新的距离度量方法来解决时间序列数据在分类中被任意数据污染的鲁棒性问题，并在 k 近邻时间序列分类中得到了有竞争力的分类精度。

Aug, 2020

一种基于分布的轨迹相似度测量方法

本文介绍了一种使用分布式内核来表示轨迹和测量其相似度的简单而强大的方法，该方法解决了轨迹测量的两个主要不足之处，并在异常检测，子轨迹异常检测和轨迹模式挖掘等任务中表现出卓越的性能。

Jan, 2023

超越有监督与无监督：图像表示学习的代表性基准测试与分析

本文提供一个综合性的比较不同无监督学习方法在图像特征表达方面的表现，使用线性评估、最近邻分类和聚类等多个基准测试来定量比较，分析了不同嵌入度量的均匀性、容忍性和中心内核对齐，并提出了两个新的度量。通过比较分析发现不能以单一流行的方法来代表整个领域的研究，在未来的工作中，应考虑如何利用这些方法的互补性。同时提供了一个统一的框架来定量数据增强不变性，并提醒不同任务需要的增强不变性类型各有差异。

Jun, 2022

文本匹配：匹配文档方法的实验评估和匹配质量度量

本文提出了一个将文本数据匹配到更高、更有比较性的结果中去的框架，并成功开发出一个预估模型可以精确预估最佳匹配结果的数值，以此提高了在媒体偏见和医学干预研究中使用文本匹配以改进因果推断的准确性。

Jan, 2018

结构数据的距离和相似性函数概述

本文主要综述了结构化表示形式下的距离函数 (或相似度函数) 在机器学习和人工智能中的应用，旨在为不同领域的研究提供参考和指明未来方向。

Feb, 2020

DTW+S：基于形状的有序局部趋势的时间序列比较

测量时间序列数据之间的距离或相似性是许多应用的基本方面，包括分类和聚类。我们的目标是开发一种可以查找相似时间点附近发生的相似趋势，并且对应用领域的研究人员易于解释的度量。我们提出了一种新颖的度量方法 DTW+S，它创建了一个可解释的时间序列 “接近保持” 矩阵表示，每一列代表局部趋势，然后应用动态时间规整来计算这些矩阵之间的距离。我们提供了支持该表示选择的理论分析。我们证明了 DTW+S 在集成构建和流行病曲线聚类中的实用性。此外，我们还证明了相对于动态时间规整在某类数据集上的分类效果更好，特别是当局部趋势而非尺度起决定性作用时。

Sep, 2023