对离散分布属性进行测试的新方法
该研究提供了关于差分隐私下 k 个元素分布的标识检测和接近度检验的上下界。他们提出了一般框架以建立隐私统计任务的样本复杂度的下界,同时通过构建精心选择的先验概率来证明隐私算法的下界。
Jul, 2017
研究了利用随机样本对离散人群进行身份和相似度测试的问题,目标是开发出高效的测试器,并保证对个人的差异性隐私,提出了一种新的方法,可以产生样本有效的差异私有测试器用于解决这些问题,实验评估证明了我们的方案能够实现与非隐私测试器几乎相同的测试效率,同时达到了样本规模亚线性的领域大小下限。
Jul, 2017
本文主要研究了离散分布的结构性质(类),提出了一个通用的算法,可以测试各种形状约束的属性,包括单调、对数凹、t - 模态、分段多项式和泊松二项式分布。此外,对于所有考虑的情况,算法在领域大小方面具有近乎最优的样本复杂度,并且计算效率高。
Jul, 2015
在非独立同分布的样本情况下,研究子线性样本属性测试和估计在哪些情形适用;给定一组分布,考虑学习或测试平均分布的属性,在某些情况下需要 $\Theta (k/\varepsilon^2)$ 样本;对于均匀性或相似性的测试,给定 $c=1$ 个样本,需要线性数量级的 $k$ 样本;$c \geq 2$ 时,恢复了独立同分布的亚线性样本测试,需要 $O (\sqrt {k}/\varepsilon^2 + 1/\varepsilon^4)$ 样本,且在 $c=2$ 的情况下,即使是线性数量级的 $\rho k$ 样本,也不能进行均匀性测试。
Nov, 2023
本文提出了对于自然广泛应用的多元产品分布,包括在已知协方差下的 Gaussians 和值域为 {±1}^d 的产品分布的新型差分私有(适合性)测试器。这些测试器相比于之前的技术得出了样本复杂度的改进,并且是第一个样本复杂度在许多参数区域与阶优化极小值样本复杂度相匹配的测试器。我们构建了两种类型的测试器,展示了样本复杂度和计算复杂度之间的权衡。最后,我们提供了多元产品分布的子类测试和单变量分布测试之间的双向约简,并因此获得了此类产品分布测试的上下界。
May, 2019
考虑从一个未知分布 $p$ 取 $m_1$ 个样本,从另一个未知分布 $q$ 取 $m_2$ 个样本的情形,介绍了一种测试是否有 $p=q$ 的快速算法,并分析了测试的样本复杂度,同时提出了估计马尔科夫链混合时间的算法及其初始样本个数的选择方法。测试算法主要依靠一种表现较为优异的统计量。
Apr, 2015