差分隐私非参数假设检验
提出了一种差分隐私保护的假设检验方法,扩展了经典的非隐私保护排列检验到隐私保护场景,从而实现有限样本有效性和差分隐私的同时保证。通过引入基于核的测试统计量,提出了两种不同差分隐私保护的核测试方法(dpMMD 和 dpHSIC),具有简单易施行、适用于多种数据类型、在不同隐私保护模式下达到极小 - 最优动力的特点。经实证评估,在各种合成和实际场景下展现出竞争力,突显其实际价值。公开提供的代码有助于我们该方法的实现。
Oct, 2023
本文基于差分隐私的限制,提出了一个新的测试统计量 $F_1$,并展示了如何严格计算 $F_1$ 的参考分布,同时给出了一个计算准确 $p$- 值的算法。与先前的工作进行比较,在相同的效应大小下,新提出的测试仅需要 7% 的数据即可获得数量级的改进。
Mar, 2019
探讨了决策理论问题中的非参数双样本检验与独立性检验,并指出使用核函数和点对之间的距离作为解决方案在高维设置中受到误解,测试的功率实际上随着维度的增加按多项式下降,提出了公平的替代假设,并阐明了核带宽选择中的中位数启发式的理论洞察力。
Jun, 2014
本研究探讨在差分隐私的约束下的条件独立性检验,设计了两种基于广义协方差度量的私有 CI 检验以及基于 Candës 等人的条件随机化检验(在模型 - X 假设下),这是第一种适用于 $ Z $ 为连续型变量的私有 CI 检验。
Jun, 2023
本研究提出了一种基于 Wasserstein 距离和核的最大均值偏差的多元非参数两样本检验方法,旨在为理论工作者和从业人员提供有用的方法子集连接。
Sep, 2015
本研究探讨了顺序非参数两样本和独立性检验的问题,提出了一种基于预测的赌博策略,用于解决高维结构化数据上核函数的选择问题。我们在实验中证明了这种方法优于基于核的方法,即使在数据分布随时间漂移的情况下,也仍然有效强大。
Apr, 2023
本文研究了如何在关系系统中估计数据之间的独立性,提出了一种基于核均值嵌入的方法,用于定义条件和边缘独立性测试,并在结构假设下实现了可伸缩的核测试方法。实证研究表明,该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。
Jun, 2022