弹性:在任意异常值存在情况下进行学习的标准
通过在任意 Wasserstein 距离下考虑扰动,实现鲁棒统计推断的推广。在这种情况下,我们首次证明了一个称为广义弹性的性质,并通过 Moment 或超对交条件证明了这种弹性的有效性。最后,我们提供了两种设计具有良好有限样本速率的 MD 估计器的不同方法,包括弱化差异和扩展分布集的方法,回顾了与 GAN 领域最近相关的研究结果。
Sep, 2019
该研究论文讨论了拜占庭机器学习中安全抵御拜占庭机器的关键问题,并提出了一种基于异常值鲁棒聚类的近似聚集器,该方法在度量标准上表现出优越性,为均匀和异构情况提供了近乎最优的聚集器。基于研究结果,提出了一个两阶段的安全聚集框架,并通过图像分类实验验证了该框架的有效性。
Dec, 2023
本文研究了计算机科学中由 Bilu, Linial (2010)和 Awasthi, Blum, Sheffet(2012)提出的微扰鲁棒性概念。作者考虑了一类基于中心的聚类问题,包括 k-means,k-median 和 k-center 等问题,并给出了一个用于聚类 2 - 扰动抵抗性实例的精确算法。该结果改进了 Balcan 和 Liang(2016)的结果,并且是最紧密的结果,除非 NP = RP,否则没有多项式时间算法能够解决(2-ε)- 扰动强度抵抗实例。作者还展示了该算法在满足比扰动强度抵抗更弱和自然的度量扰动强度抵抗条件的实例上的表现。
Jul, 2016
本研究探讨了使用自然低秩表示训练神经网络以提高分类器对抗干扰抵抗力的效果,并提出了一种基于乘法权重更新方法且具有可证明保证的快速算法,以使得网络对于特定类型的干扰具有认证的鲁棒性。
Jul, 2020
我们提出了一个分布式坚韧的学习框架,可以应用于大数据中存在的污染数据。在此框架中,我们将统计学习方法与分布式计算相结合,保证了基准鲁棒学习方法的鲁棒性,并且在计算节点上具有容错能力,可以允许计算节点的失效。我们详细分析了这种框架的鲁棒性能,并以分布式坚韧主成分分析和分布式坚韧回归为例,通过大规模模拟和预测图像标签的实验来展示了其效率和优越性。
Sep, 2014
本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型,使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集,通过估计数据漂移量建立了鲁棒性,并在多个基准数据集上进行了实验证明了该方法的重要性。
Aug, 2020
本文考虑了 Bilu 和 Linial(2010)提出的模型,研究了最佳聚类不发生变化的问题,我们发现即使问题是 NP 困难的,有时候也可能获得有效算法,这些算法对于特定的多项式扰动是鲁棒的。同时,我们证明了该区间内的乘法鲁棒性参数可能太强,以至于聚类问题变得微不足道,只有一个较窄的区间是有趣的。
Jul, 2011
本文首次给出了一个多项式时间算法,用于在示例和标签中对抗性堕落下执行线性或多项式回归,并基于 SoS 方法提出了一种自然的凸松弛方法来解决非凸优化问题。
Mar, 2018
本研究提出了一种分布鲁棒的随机优化框架,利用凸形式化来解决学习模型受到数据生成分布扰动的问题,并通过多项收敛性保准来证明模型的可靠性,同时也得出了极限定理及有关泛化到未知人群、精细化认知等真实任务的证据。
Oct, 2018