本文介绍了一种新的基于样本汇总上的相似性图构建的新型检验统计量,适用于多元数据和非欧几里得数据,可以通过定义样本空间上的不相似性度量,使用于匹配观测研究中的协变量平衡评估和比较网络数据等问题,并在模拟研究中表现出明显的功效提升。
Jul, 2013
本文针对大型图形的两样本检验问题,比较和探讨现有的理论检验方法及其自举变体的实际优劣,并提出两种运用渐近分布的新的检验方法,其较现有方法具有更低的计算复杂度和更高的可靠性。
Nov, 2018
该研究提出了一类非参数两样本检验,其代价与样本大小成线性关系;文中给出了两种基于代表每个分布的解析函数距离集合的检验方法,其中第一种检验使用平滑的经验特征函数来表示分布,第二种使用再生核 Hilbert 空间中的分布嵌入。该方法具有更好的功率 / 时间平衡,并在高维度情况下保留了性能优势。
Jun, 2015
本研究提出了一种基于 Wasserstein 距离和核的最大均值偏差的多元非参数两样本检验方法,旨在为理论工作者和从业人员提供有用的方法子集连接。
Sep, 2015
本文提出了在假设检验中对比 Facebook 和 LinkedIn 上的友谊网络的解决方案,利用网络统计学衡量网络。通过对网络统计学的集中度进行通用表述,揭示了一个自然的对策,实现了一致的双样本测试。本文还证明,对于某些网络统计量,所提出的测试是最小最优的。
May, 2017
本研究提出了一种在图结构环境下解决多个双样本检验问题的方法,通过非参数协同双样本检验框架(CTST),利用图结构并最小化对概率密度函数的假设,综合了 f - 差异度估计、核方法和多任务学习的元素。通过合成实验和监测地震活动的传感器网络,证明 CTST 优于现有的非参数统计检验方法,因为该方法能够考虑问题的几何特性。
Feb, 2024
本文以最小极小值检验的角度考虑解决在高维信息检测中,两个离散随机图集合的假设检验问题,并提出了 Frobenius 范数和算子范数算法,能在小样本量下有效地求解较为稀疏的两种份离散图模型问题。
Jul, 2017
研究了分布检测的样本测试的复杂度问题,提出了两种技术方法,一种是提供样本最优测试器,另一种是提供匹配样本下界。作者解决了大量重要的测试问题并证明了样本最优性,并且得到了第一个样本最优的对应测试器。
Jan, 2016
本文对一种设计用于一般替代情况的流行的非参数双样本测试的功率进行了明确表征,并探讨了这些针对一般替代情况的测试在面对简单情况时的表现,具有高维场景下一般非参数测试的第一次明确功率推导以及如何在两个分布均值不同时,通过高斯核推导出最大均值偏差统计量的功率的性质。
Nov, 2014
提出一种基于重现核希尔伯特空间和大偏差界限的统计检验框架,可用于分析和比较分布,特别对于数据库属性匹配具有很好的性能表现。
May, 2008