相关性检测
研究了在名义概率分布受到建模误差和异常值影响的情况下的极小极大稳健假设检验问题,并设计了一个基于相对熵距离的稳健假设检验方案,该方案提高了对建模误差的稳健性,并且是之前 Levy 提出的工作的推广。然后,证明了可以通过复合不确定性类将此方案与 Huber 的稳健检验相结合,并证明了鞍值条件的存在。同时,将稳健度量方法扩展到了固定样本量和顺序概率比测试,并将组合模型推广到稳健估计问题。最后,模拟实验验证了所提出的论断。
Feb, 2015
本文研究使用不存在标签分类来进行异常检测,并设计了一种假设检验方法来排除仅有背景假设。通过测试两个数据集区域的统计独立性,我们能在不依赖定量异常得分或区域间背景估计外推的情况下排除仅有背景假设。我们的方法依赖于异常得分特征和数据集区域的条件独立性假设,这可以通过使用现有的去相关技术来保证。我们以 LHC Olympics 数据集为基准示例,证明互信息是测试统计独立性的合适方法,并且我们的方法即使在实际特征相关性存在的情况下,在不同信号分数下也表现出良好且稳健的性能。
Oct, 2022
我们提出了一个通用的框架,用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务,如双样本测试、独立性测试和条件独立性测试,以及现代问题,如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势:1) 它持续监控在线数据流并有效地聚合针对零假设的证据,2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制,3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架(testing-by-betting framework)中利用机器学习模型的表示能力方面开发了一种基于原则的方法,这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明,使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。
Oct, 2023
本研究提出了一种在高维线性模型中测试线性假设的方法,可以不对模型的大小(即模型的稀疏性或表示假设的加载向量)进行任何限制,并通过测试与新设计的重组回归模型相关的时刻条件来实现。
Oct, 2016
本文研究高维模型中低维部分的不确定性评估问题,提出了一种去相关的评分函数来处理高维噪声参数的影响,不同于现有方法的针对性,我们的方法提供了一种适用于广泛应用的高维推理通用框架。
Dec, 2014
本文介绍了一种新的方法,称为低次方法,用于预测和理解高维推断问题中的统计与计算权衡,并给出了一些新的结果、简化的证明和改进的猜想。该方法假定一个特定数量 —— 低次似然比的第二时刻 —— 可以揭示解决给定假设检验问题所需的计算时间的信息,进而可用于预测各种统计推断任务的计算复杂度。
Jul, 2019
使用 Hilbert-Schmidt 独立准则(HSIC)测量依赖性,建立了新型非参数统计假设检验方法,用于确定一个源变量对于两个候选目标变量的依赖性。测试表明第一个依赖度量是否显著大于第二个,其结果表明建立这些 HSIC 统计数据之间的协方差计算比独立 HSIC 统计量的子采样法更有效。
Jun, 2014
该论文提出了一种用于高维模型中单个或低维组件的置信区间和统计检验的一般方法,可轻松调整用于考虑测试之间的依赖关系。该方法还自然地扩展到具有凸损失函数的广义线性模型。
Mar, 2013