- 在线估计和推断:强化学习中鲁棒政策评估
我们在强化学习中开发了一种在线鲁棒的策略评估过程,并基于其巴哈多表示建立了我们估计器的极限分布。此外,我们还开发了一种完全在线的过程,以基于渐近分布进行高效的统计推断。本文将鲁棒统计与强化学习中的统计推断联系起来,为策略评估提供了一种更多功 - ICML重新思考后门攻击
通过分析训练数据的结构信息,我们对反向门攻击问题提出了一种不同的方法,指出这些攻击在一般情况下是不可能被检测到的。基于此观察,我们重新审视了现有的反向门攻击防御措施并对其隐含的假设进行了表征。最后,基于假设条件,我们提出了一种新的原始方法来 - 拜占庭攻击下的联邦多臂老虎机
本文研究了存在拜占庭攻击的联邦多臂老虎机问题,并借鉴了鲁棒统计学中的方法提出了一种名为 Fed-MoM-UCB 的估算器,通过实验证明了其在面对拜占庭攻击时的有效性。
- 高维下的差分隐私和鲁棒统计学
通过引入高维度的 Propose-Test-Release(HPTR)框架,概括表征具有差分隐私保证的统计估计问题的统计效率,以及基于差分隐私保证的健壮统计和对数学分析的需求。
- 稳健地学习 $k$ 个任意高斯分布的混合
在固定 $k$ 个任意高斯分布的混合物和常量级别的数据污染的情况下,我们提出了一个用于稳健估计的多项式时间算法。该算法的主要工具有基于平方和方法的有效局部聚类算法和允许 Frobenius 范数和低秩项误差的新型张量分解算法。
- 通过遗憾最小化实现健壮和重尾均值估计的简化
本文提供一个元问题和一个对偶定理,通过这个元问题和对偶定理,我们从新的统一的视角研究了高维健壮统计和重尾分布均值估计问题,并展示了一个既简单又高效的算法,该算法用于处理两个不同问题通过两种算法最终合并实现了 “大同小异”
- 源代码神经模型中的后门
本文介绍了如何在源代码任务中注入后门 (backdoors),并证明了如何使用鲁棒统计学算法来检测恶意数据。
- ICML使用学生化流进行稳健的模型训练与泛化
本文讨论利用鲁棒统计学的见解进一步改进基于流模型的方法,具体地,使用多变量的学生 $t$ 分布, 替代传统标准化流使用的高斯分布。实验证明,使用更胖尾的基础分布可以提高算法的容错性并减少一般化差距,而不损害方法的渐近一致性和去其损失数据似然 - 广义韧性与健壮统计学
通过在任意 Wasserstein 距离下考虑扰动,实现鲁棒统计推断的推广。在这种情况下,我们首次证明了一个称为广义弹性的性质,并通过 Moment 或超对交条件证明了这种弹性的有效性。最后,我们提供了两种设计具有良好有限样本速率的 MD - 一种健壮均值估计的统一方法
本研究发展了稳健统计中 Huber 的 epsilon 污染模型和重尾噪声模型的连接,并在此基础上提供了一种简单的变体,用于 Huber 模型中的均值估计,同时具有鲁棒性和计算效率。进一步地,我们的算法采用最优统计鲁棒策略,实现了在两个模型 - IJCAIRobustTrend: 一个利用组合的一阶和二阶差分正则化的 Huber 损失函数进行时间序列趋势过滤的方法
本文提出一种基于鲁棒统计和稀疏学习的趋势过滤算法,采用 Huber 损失压制离群值并利用一阶和二阶差分组合作为正则化以捕捉缓慢和突变的趋势变化,通过主元最小化与多项式替代方向法设计出有效的方法来解决鲁棒趋势过滤,实验证明该算法优于其他九种最 - NIPS后门攻击中的光谱签名
本文发现所有已知的后门攻击都具有一种称为 “光谱签名” 的新特性,并使用鲁棒性统计工具来检测和清除受污染的样本,以保护深度学习系统免受数据投毒和后门攻击。
- 污染老虎机的最佳臂识别
本文在稳健统计学的背景下研究主动学习。具体而言,我们为受到污染的赌臂问题提出了一个变体,其中每个臂的拉动具有生成任意污染分布样本的概率 ε,而不是真正的基础分布。我们开发了紧凑的、非渐进的样本复杂度界限来高概率地估算受到污染的样本的前两个鲁 - ICML差分隐私统计估计的收敛速率
本研究探讨了差分隐私的统计估计问题,并且提出了差分隐私比较准确的估计方法,其中加入了随机噪声以提高数据的隐私保护性,同时也介绍了 Gross Error Sensitivity,将其与差分隐私紧密联系。
- 新一代调查的可靠特征谱
利用鲁棒统计和递归算法相结合的方法,我们提出了一种新的技术来克服主成分分析在应用于典型实际数据集,尤其是天文光谱方面的局限性,通过开发通用机制,可以在不需要手动审查数据的情况下获取可靠的特征谱,并利用所有观测数据的信息。通过对 VIMOS - 高击穿强健多元方法
这篇研究论文概述了近期在多元设置中,如协方差估计、多元线性回归、判别分析、主成分和多元校准等方面使用的高容错鲁棒性方法,以应对数据中一些未预料到的异常值所带来的影响。