一种快速计算距离相关性的算法
本研究介绍了一类新的多元相关系数 —— 距离相关系数,其应用于任意维度的随机向量。距离协方差与距离相关系数类似于经典的二元依赖度量,但是它们能够推广和扩展这些经典的二元依赖度量,并可以表征独立性,即它仅当随机向量独立时为 0。研究还介绍了与随机过程相关的协方差的概念,并证明了人口距离协方差与布朗运动相关的协方差相一致;因此,两者都可以称为布朗距离协方差。研究还讨论并阐述了应用布朗协方差和相关性相对于经典的 Pearson 协方差和相关性的优点,并加以说明。
Oct, 2010
该篇研究提出了一个新的 Hilbert 空间来定义偏距相关性的概念,并发展和实现了一个测试器,用于检验偏距相关性是否为零。同时提出了用于计算偏距协方差的无偏估计器和用于衡量不同度量方式的距离相关性问题的简洁解决方案。
Oct, 2013
使用随机投影和距离相关性基础上的独立性测试方法 RPDC,其计算复杂度为 O (nKlogn),在多元情况下表现良好,并具有与最先进的距离方法近乎相同的功率。
Jan, 2017
本文回答了一个问题:是否可能定义一个与经典相关系数(如 Pearson's correlation or Spearman's correlation)一样简单的相关系数,并且能够一致估计出某种简单可解释的度量变量之间相互依赖程度的度量,满足该度量当且仅当变量是独立的时候为 0,且当且仅当其中一个是另一个的可测函数时为 1,且在独立假设下具有简单的渐近理论,并通过提出这样一个系数来肯定这一点,而在该文中,变量的分布不需要做出任何假设。
Sep, 2019
本文提出了一种基于 copula 的新型随机变量依赖度测量方法,延伸了 MMH 方法至联合分布的 copula,该方法类似于 Shannon 互信息,能够不受边缘变量任何严格增加变换的影响,重要的是在很多应用中,例如特征选择。本文通过一系列实验说明了理论贡献的作用在于特征选择和低维分布嵌入中。同时,该方法的估计是始终如一的,对离群值具有鲁棒性,并仅使用排名统计数据。该方法提出了收敛速率和独立性检验的上界。
Jun, 2012
本文证明在连续的随机变量情况下测试条件独立性是一个特别困难的问题,我们提出了一种基于非线性回归和基于样本协方差的测试统计量 —— 广义协方差测度(GCM)方法,并在内核岭回归的理论保证下扩展到处理多变量或高维数据的场景,仿真研究表明,GCM 测试具有与现有条件独立性测试相竞争的能力。
Apr, 2018
本文研究了协方差矩阵的估计问题,当仅有小部分样本被恶意更改时,我们提出了一种运行时间接近计算经验协方差且具有最佳误差保证的算法,该算法适用于高维分布,能处理高斯分布等深度分布结构及矩阵乘法指数中的病态情形。
Jun, 2019
本文研究了时间序列比较中的标准化 Z-score 欧几里得距离与 Pearson 相关性距离的等价性及其对基于距离的分类或聚类方法的深刻影响,并提出了标准 k-Means 算法需要修改以保持与 Pearson 相关性的严格一致性的建议。实验结果表明,标准 k-Means 算法通常产生相同的结果。
Jan, 2016