序列预测双样本和独立性检验
我们提出了一个通用的框架,用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务,如双样本测试、独立性测试和条件独立性测试,以及现代问题,如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势:1) 它持续监控在线数据流并有效地聚合针对零假设的证据,2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制,3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架(testing-by-betting framework)中利用机器学习模型的表示能力方面开发了一种基于原则的方法,这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明,使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。
Oct, 2023
本文研究了如何在关系系统中估计数据之间的独立性,提出了一种基于核均值嵌入的方法,用于定义条件和边缘独立性测试,并在结构假设下实现了可伸缩的核测试方法。实证研究表明,该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。
Jun, 2022
提出了一种非参数顺序检验方法,可解决在线随机实验中出现的复杂度量的假设检验以及在持续监控下如何防止类型 I 错误膨胀的问题。该方法无需了解数据生成的概率分布,利用 Bootstrap 估计数据块的似然,然后采用混合序列概率比检验。在来自一家重要的在线电商网站的数据上验证了该过程。结果表明,该检验在任何时候都能控制 I 型错误,在在线随机实验中具有良好的功率,对于数据生成的分布错误具有鲁棒性,并且允许快速推断。
Oct, 2016
该论文提出了一种新的算法框架,用于解决顺序假设检验问题,包括 A/B 测试、非参数双样本测试和独立性测试等。该算法具有线性时间和恒定空间计算的优势,并且在处理复杂问题时能够动态调整中止时间以适应,同时其零均值鞅的检验统计量也采用了一致的 LIL 控制拒绝门槛。
Jun, 2015
探讨了决策理论问题中的非参数双样本检验与独立性检验,并指出使用核函数和点对之间的距离作为解决方案在高维设置中受到误解,测试的功率实际上随着维度的增加按多项式下降,提出了公平的替代假设,并阐明了核带宽选择中的中位数启发式的理论洞察力。
Jun, 2014
提出了一种基于条件互信息和局部置换方案的全非参数连续数据测试方法,能够适应强非线性相关性,表现优于基于核的测试,并在小样本和高维条件下可靠地模拟零分布。
Sep, 2017
文中提出了一种新的非参数化方法用于测试两个随机过程之间的独立性,使用了 Hilbert Schmidt 独立性准则(HSIC)作为检验统计量,该方法针对从随机过程中绘制的样本计算 HSIC 的渐近行为得到了建立,并且推荐了一种可替代的 p 值的一致估计,与线性方法相比,该新测试程序可以发现被线性方法忽略的依赖关系,而先前的自举程序会返回大量错误的结果。
Feb, 2014
本研究研究了不同隐私性的统计假设检验方法,包含常规与非参数检验方法,并使用特定于隐私数据的新型检验统计量,比较结果表明,我们的新型非参数检验方法在统计功效上有巨大改进。
Mar, 2019
本文通过对大规模核逼近方法的研究,对比块状、Nystrom 和随机 Fourier 特征方法的性能,展示了这些新型的大规模方法在独立性检验中具有与现有方法相当的性能,但使用的计算时间和内存显著减少。
Jun, 2016