相关性检测

Jun, 2011

Detection of correlations

Ery Arias-Castro, Sébastien Bubeck, Gábor Lugosi

TL;DR研究高维向量假设检验问题，该问题决定观察到的向量是否具有独立的正态分量，或者是否具有一小部分相关分量。相关分量可能具有某个已知的组合结构。通过建立相关子集的大小、相关水平和可能相关集合的结构的上下界，确定最小化风险。研究表明在许多情况下，一些简单的测试具有接近最优的性能，而广义极大似然比测试在一些重要情况下是次优的。

Abstract

We consider the hypothesis testing problem of deciding whether an observed high-dimensional vector has independent normal components or, alternatively, if it has a small subset of →

hypothesis testing high-dimensional vectors independent normal components correlated components minimax risk

发现论文，激发创造

相关随机向量的检测

研究标准正态随机向量之间是否存在相关性的假设检验问题，提出了信息理论下界的评估方法，同时探索了多维情况下观察两个数据库 / 矩阵之间的部分相关性。

Jan, 2024

高维多元分布的假设检验：一篇选择性综述

本文评述了一些最近为高维多项分布提出的假设检验方法，并且指出了通过采取 minimax 的视角可以自然地得到强有力且实用的检验。

Dec, 2017

极小极大鲁棒假设检验

研究了在名义概率分布受到建模误差和异常值影响的情况下的极小极大稳健假设检验问题，并设计了一个基于相对熵距离的稳健假设检验方案，该方案提高了对建模误差的稳健性，并且是之前 Levy 提出的工作的推广。然后，证明了可以通过复合不确定性类将此方案与 Huber 的稳健检验相结合，并证明了鞍值条件的存在。同时，将稳健度量方法扩展到了固定样本量和顺序概率比测试，并将组合模型推广到稳健估计问题。最后，模拟实验验证了所提出的论断。

Feb, 2015

异常检测的零假设检验

本文研究使用不存在标签分类来进行异常检测，并设计了一种假设检验方法来排除仅有背景假设。通过测试两个数据集区域的统计独立性，我们能在不依赖定量异常得分或区域间背景估计外推的情况下排除仅有背景假设。我们的方法依赖于异常得分特征和数据集区域的条件独立性假设，这可以通过使用现有的去相关技术来保证。我们以 LHC Olympics 数据集为基准示例，证明互信息是测试统计独立性的合适方法，并且我们的方法即使在实际特征相关性存在的情况下，在不同信号分数下也表现出良好且稳健的性能。

Oct, 2022

深度实时假设测试

我们提出了一个通用的框架，用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务，如双样本测试、独立性测试和条件独立性测试，以及现代问题，如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势：1) 它持续监控在线数据流并有效地聚合针对零假设的证据，2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制，3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架（testing-by-betting framework）中利用机器学习模型的表示能力方面开发了一种基于原则的方法，这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明，使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。

Oct, 2023

稠密高维线性模型中的线性假设检验

本研究提出了一种在高维线性模型中测试线性假设的方法，可以不对模型的大小（即模型的稀疏性或表示假设的加载向量）进行任何限制，并通过测试与新设计的重组回归模型相关的时刻条件来实现。

Oct, 2016

稀疏高维模型假设检验和置信域的一般理论

本文研究高维模型中低维部分的不确定性评估问题，提出了一种去相关的评分函数来处理高维噪声参数的影响，不同于现有方法的针对性，我们的方法提供了一种适用于广泛应用的高维推理通用框架。

Dec, 2014

关于假设检验的计算困难性注记：使用低阶似然比进行预测

本文介绍了一种新的方法，称为低次方法，用于预测和理解高维推断问题中的统计与计算权衡，并给出了一些新的结果、简化的证明和改进的猜想。该方法假定一个特定数量 —— 低次似然比的第二时刻 —— 可以揭示解决给定假设检验问题所需的计算时间的信息，进而可用于预测各种统计推断任务的计算复杂度。

Jul, 2019

相对依赖性的低方差一致性测试

使用 Hilbert-Schmidt 独立准则（HSIC）测量依赖性，建立了新型非参数统计假设检验方法，用于确定一个源变量对于两个候选目标变量的依赖性。测试表明第一个依赖度量是否显著大于第二个，其结果表明建立这些 HSIC 统计数据之间的协方差计算比独立 HSIC 统计量的子采样法更有效。

Jun, 2014

关于高维模型渐近最优置信区间和检验

该论文提出了一种用于高维模型中单个或低维组件的置信区间和统计检验的一般方法，可轻松调整用于考虑测试之间的依赖关系。该方法还自然地扩展到具有凸损失函数的广义线性模型。

Mar, 2013