稀疏均值估计算法在存在对抗性异常值的情况下的研究,提出了一种在次二次时间内运行的鲁棒稀疏均值估计算法,并在检测弱相关性方面取得了算法进展。
Mar, 2024
本文研究在高维度及受到恶意破坏性干扰情况下,稀疏估计任务能否有效地完成,并提供了一些在存在噪音的情况下,提供非平凡误差保证的有效算法。研究表明,在这些问题上存在着计算与统计之间的差距。
Feb, 2017
研究估计具有有界平均值和协方差的重尾随机向量均值的算法问题,提供了一种基于谱方法的算法来解决该问题,并且只需要计算近似特征向量,取得了最优的统计性能和更快的运行速度。
Aug, 2019
本文针对高维下平均数估计的稳健模型、对抗性污染和相应算法进行研究,提出了一种基于当前猜测值参数化的 SDP 族的自然算法,并经证明该算法在次线性时间内逼近真实平均数并达到了理论误差的信息论最优解,同时认为该算法还能进一步实现高维稳健学习问题的次线性时间算法。
Nov, 2018
研究高维稀疏估计任务中的鲁棒性问题,提出使用基于谱技术的迭代式方法消除数据中的离群值,实现高效稳健的稀疏均值估计和稀疏主成分分析。
Nov, 2019
高斯稀疏估计在 Huber 污染模型中研究,针对均值估计、主成分分析和线性回归三个任务,提出了第一个样本和计算高效的鲁棒估计器,保证了较小的误差,并且在常数因子内达到最优。之前针对这些任务的高效算法都产生了数量上次优的误差。具体而言,对于高斯的鲁棒 k 稀疏均值估计在具有污染率为 ε>0 的 R^d 上,我们的算法具有样本复杂度为 (k^2/ε^2)・polylog (d/ε),在多项式时间内运行,并且在 L2 误差为 O (ε) 的范围内逼近目标均值。之前的高效算法固有地产生了误差 Ω(ε√log (1/ε))。在技术层面上,我们开发了一种在稀疏情况下的新型多维过滤方法,可能具有其他应用。
提出了一种用于高维度稀疏回归中具有常量分数的自变量和 / 或响应变量的污染的算法,它是迄今为止的首个这样的算法,利用使用这种算法,我们提供了强健的稀疏回归方法和过滤算法。
May, 2018
我们研究了稀疏线性回归的计算统计缺口,证明了这个问题需要至少大约 k^2 个样本才能有效解决,并且还应用于稀疏 PCA 问题的降低及低阶下界。
Feb, 2024
该论文阐述了在自然情况下改善多项式算法稳健均值估计误差率在计算上可能是不可行的,并探索了改善现有算法的错误率的自然方法,并证明了这将意味着小集合扩展问题的有效算法。
Mar, 2019
本文研究了一个基于迭代重新加权的估计方法,该方法针对多元高斯分布的均值具有鲁棒性,且具有多个优秀性质,包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外,本文还为提出的估计器建立了无维度的非渐近风险界限,并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。
Feb, 2020