考虑在包含 ε 部分恶意数据源的情况下学习离散分布的问题,提供两种算法:一种在支持集大小 n 的指数时间复杂度下恢复 p,第二种在适用于 η = 0 的情况下,通过近似一个张量来实现,虽然其运行时间为 poly ((nk)^k),但可以提供 O(ε/√k)的恢复保证,这可能具有独立的利益。
Nov, 2017
研究了在数据存在噪声和对抗性的情况下如何进行鲁棒学习,同时提出了有效的学习算法来解决分段区间分类和分布估计的问题。
Feb, 2020
本研究通过样本的简化抽样学习了一个代表复杂模型的概率分布,该模型有广泛的应用范围,包括无监督学习,主题模型和协同过滤。
Apr, 2015
本文针对高维高斯分布参数学习问题进行了研究,提出了鲁棒估计算法,在拥有少量恶意样本的情况下实现了 $O (ε)$ 精度的估计,同时也证明了算法的多项式时间复杂度和多项式数量样本要求。
Apr, 2017
该研究旨在解决高维分布学习中的拜占庭敌人问题,提出了面向单高斯、超立方体上的乘积分布及其混合分布和球形高斯的分布学习的算法,并为高维数据的拜占庭敌人问题提供了一种通用的检测与纠正方案。
Apr, 2016
研究了在高维高斯混合假设下,少量数据受到对手损坏的情况下的高效可学习性,提出了一种多项式算法并证明了在成分经过配对后在总变异距离上分离时,该问题是可多项式学习的;这种算法是第一个可处理 $k=2$ 的高斯混合问题的多项式时间算法,并使用基于 Sum-of-Squares 证明算法的技术,提出了一种新的用于高斯混合的鲁棒可辨识性证明方法和使用 SoS 可证明的反集中方法和新的特征距离度量组来解决问题。
May, 2020
提出了一种基于混合学习算法的 PAC 学习方法,该算法可用于密度估计中的概率分布,其中包含了学习概率分布,学习混合分布等,其中混合分布包括轴向高斯混合分布,高斯混合分布和对数凹分布。
Jun, 2017
本文基于 Sum of Squares 方法,探讨了用于高维下学习高度分离的高斯混合物和鲁棒均值估计的新有效算法,进一步优化了以往算法的统计保障。通过在高度分离的高斯混合物和穿插噪音后的子高斯分布上实现均值估计,我们的方法多次突破优化算法的极限。
探讨在机器学习中存在恶意数据时的问题,其中的 list-decodable learning 和 semi-verified learning model 框架及稳健学习算法提供强大的解决方案。
Nov, 2016
在很多学习应用中,数据来自多个来源,每个来源提供的样本批次本身无法足够学习其中的输入 - 输出关系。本文提出了一种基于梯度的新算法,通过解决多个问题改进了现有结果的适用性,包括允许子群的底层输入分布不同、未知和重尾、复原所有子群以及一个重要批次规模甚至可以为无穷大等。
Sep, 2023