May, 2024

数据损坏下的鲁棒核假设检验

TL;DR提出了两种构建在数据损坏下鲁棒的排列检验的方法,能有效控制非渐近型 I 型错误,并证明在最小条件下的功效一致性,在实际应用中有助于假设检验的部署,特别适用于可能的对抗攻击。其中一种方法具有差分隐私,并进一步扩大了其在私有数据分析中的适用性。对于双样本和独立性设置,我们展示了我们的核鲁棒检验是极小化准则下的最佳,意味着它们在某些最佳速率下(紧密匹配下界)能保证非渐近地对抗空值在核 MMD 和 HSIC 度量下的备择假设有力。最后,我们提供了可公开访问的实现,并实证了我们提出测试的实用性。