序列预测双样本和独立性检验

Apr, 2023

Sequential Predictive Two-Sample and Independence Testing

Aleksandr Podkopaev, Aaditya Ramdas

TL;DR本研究探讨了顺序非参数两样本和独立性检验的问题，提出了一种基于预测的赌博策略，用于解决高维结构化数据上核函数的选择问题。我们在实验中证明了这种方法优于基于核的方法，即使在数据分布随时间漂移的情况下，也仍然有效强大。

Abstract

We study the problems of sequential nonparametric two-sample and independence testing. Sequential tests process data online and allow using observed data to decide whether to stop and reject the null hypothesis or to collect more data while maintaining type I error control. We build upon the principle of (nonparametric) testing by betting, where a gambler pl

sequential testing nonparametric testing betting strategies structured data prediction-based

发现论文，激发创造

深度实时假设测试

我们提出了一个通用的框架，用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务，如双样本测试、独立性测试和条件独立性测试，以及现代问题，如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势：1) 它持续监控在线数据流并有效地聚合针对零假设的证据，2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制，3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架（testing-by-betting framework）中利用机器学习模型的表示能力方面开发了一种基于原则的方法，这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明，使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。

Oct, 2023

关系依赖关系的非参数推断

本文研究了如何在关系系统中估计数据之间的独立性，提出了一种基于核均值嵌入的方法，用于定义条件和边缘独立性测试，并在结构假设下实现了可伸缩的核测试方法。实证研究表明，该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。

Jun, 2022

条件独立性的实用核检验

描述了一种数据高效、基于核的条件独立性统计检验方法，通过数据拆分、辅助数据和更简单的函数类别等方法，控制偏差并校正测试水平，适用于合成和真实数据。

Feb, 2024

一种非参数序列检验用于在线随机实验

提出了一种非参数顺序检验方法，可解决在线随机实验中出现的复杂度量的假设检验以及在持续监控下如何防止类型 I 错误膨胀的问题。该方法无需了解数据生成的概率分布，利用 Bootstrap 估计数据块的似然，然后采用混合序列概率比检验。在来自一家重要的在线电商网站的数据上验证了该过程。结果表明，该检验在任何时候都能控制 I 型错误，在在线随机实验中具有良好的功率，对于数据生成的分布错误具有鲁棒性，并且允许快速推断。

Oct, 2016

迭代对数定理下的顺序非参数检验

该论文提出了一种新的算法框架，用于解决顺序假设检验问题，包括 A/B 测试、非参数双样本测试和独立性测试等。该算法具有线性时间和恒定空间计算的优势，并且在处理复杂问题时能够动态调整中止时间以适应，同时其零均值鞅的检验统计量也采用了一致的 LIL 控制拒绝门槛。

Jun, 2015

高维下核和距离非参数假设检验能力减弱

探讨了决策理论问题中的非参数双样本检验与独立性检验，并指出使用核函数和点对之间的距离作为解决方案在高维设置中受到误解，测试的功率实际上随着维度的增加按多项式下降，提出了公平的替代假设，并阐明了核带宽选择中的中位数启发式的理论洞察力。

Jun, 2014

基于最近邻估计器的条件互信息独立性检验

提出了一种基于条件互信息和局部置换方案的全非参数连续数据测试方法，能够适应强非线性相关性，表现优于基于核的测试，并在小样本和高维条件下可靠地模拟零分布。

Sep, 2017

随机过程的核独立性检验

文中提出了一种新的非参数化方法用于测试两个随机过程之间的独立性，使用了 Hilbert Schmidt 独立性准则（HSIC）作为检验统计量，该方法针对从随机过程中绘制的样本计算 HSIC 的渐近行为得到了建立，并且推荐了一种可替代的 p 值的一致估计，与线性方法相比，该新测试程序可以发现被线性方法忽略的依赖关系，而先前的自举程序会返回大量错误的结果。

Feb, 2014

差分隐私非参数假设检验

本研究研究了不同隐私性的统计假设检验方法，包含常规与非参数检验方法，并使用特定于隐私数据的新型检验统计量，比较结果表明，我们的新型非参数检验方法在统计功效上有巨大改进。

Mar, 2019

大规模核方法独立性检验

本文通过对大规模核逼近方法的研究，对比块状、Nystrom 和随机 Fourier 特征方法的性能，展示了这些新型的大规模方法在独立性检验中具有与现有方法相当的性能，但使用的计算时间和内存显著减少。

Jun, 2016