线性回归混合物的鲁棒学习
在高维情况下,使用平滑分析方法可以在多项式时间内使用多项式数量的样本学习带有随机扰动参数的高斯混合模型, 通过利用高斯分布的高阶矩的组合结构并推导其对称性,探索新的高斯混合物的时刻张量的分解方法以及构建结构化随机矩阵的奇异值的下界。
Mar, 2015
通过使用硬阈值化的新颖变体,本文提出了一种快速的鲁棒估计器,可以有效地解决使用响应变量损坏的鲁棒线性回归问题,并通过应用于不同的扰动模型,展示了其估计能力的稳健性。
Mar, 2019
提供了一种有效的算法,用于鲁棒聚类混合的两个任意高斯分布,该算法将扩展到鲁棒聚类混合的分布更广泛的情况,通过使用基于等位置和费舍尔判别式的新可辨识性标准和相应的固定度数的平方和凸松弛。
Nov, 2019
研究了在高维高斯混合假设下,少量数据受到对手损坏的情况下的高效可学习性,提出了一种多项式算法并证明了在成分经过配对后在总变异距离上分离时,该问题是可多项式学习的;这种算法是第一个可处理$k=2$的高斯混合问题的多项式时间算法,并使用基于Sum-of-Squares证明算法的技术,提出了一种新的用于高斯混合的鲁棒可辨识性证明方法和使用SoS可证明的反集中方法和新的特征距离度量组来解决问题。
May, 2020
研究了高维稳健线性回归问题,在受到对抗性破坏的情况下提出了估计方法,包括样本复杂度,恢复保证,运行时间等关键指标,并利用近期算法发展的加速算法和高斯舍入技术等方法来优化估计器的运行时间和统计样本复杂性。
Jul, 2020
本文介绍了学习高斯混合分布和算法鲁棒性统计的自然融合,提出了第一个可靠的算法,用于学习任意数量的高斯混合物,且仅需要混合权重(有界分数性)和成分之间的总变差距离与零保持一定距离的温和假设条件。算法的核心是一种新的方法,通过对某些生成函数应用一系列精心选择的微分运算来证明维度无关的多项式可辨识性,这些生成函数不仅编码了我们想要学习的参数,还编码了我们想要解决的多项式方程系统。我们展示了如何直接使用我们推导出的符号身份来分析自然的平方和松弛问题。
Nov, 2020
在固定$k$个任意高斯分布的混合物和常量级别的数据污染的情况下,我们提出了一个用于稳健估计的多项式时间算法。该算法的主要工具有基于平方和方法的有效局部聚类算法和允许Frobenius范数和低秩项误差的新型张量分解算法。
Dec, 2020
研究稀疏优化问题中的算法和局限性,探索稀疏线性回归和鲁棒线性回归问题,在此基础上展示了鲁棒回归问题的二准则、NP-近似困难性,给出了一个使用近似最近邻数据结构的鲁棒回归算法,并且介绍了一个从鲁棒线性回归到稀疏线性回归的通用带宽率约化算法。
Jun, 2022