抗腐败的利普希茨上下文搜索
本文提出了第一行对抗下的强、弱 Lipschitz bandit 算法,能在无总损坏预算的情况下,在两种类型的对手下实现次线性后悔,但强对手情况下表现最优,并通过对两种经典攻击的试验证明了该算法的有效性。
May, 2023
本文从对抗鲁棒性的角度重新审视了两个经典的高维在线学习问题,即线性回归和情境地图,并探究了无需假设数据分布,直接从全局角度保证它们对抗鲁棒的可行性。具体方法是通过交替最小化策略将普通最小二乘法嵌入到简单的凸约束计算不完整数据下的最优加权分布,并证明该方法在污染程度方面具有最佳的可重复性和完整性。
Oct, 2020
将随机赌徒模型扩展到对抗性破坏模型,并应用于随机线性优化问题,采用 L"owner-John 椭球进行探索,并将时间分割成指数递增的时代以限制破坏的影响,使得算法对于适应性对手所选择的破坏的数量不可知,其遗憾只会在破坏数量线性增加时增加。
Sep, 2019
本文首次给出了一个多项式时间算法,用于在示例和标签中对抗性堕落下执行线性或多项式回归,并基于 SoS 方法提出了一种自然的凸松弛方法来解决非凸优化问题。
Mar, 2018
通过校准的利普希茨边界 - 边际损失(CLL)方法,本论文针对对抗性样本、利普希茨边界和预测边际进行研究,提出了改进的鲁棒性证明,通过解决输出分布缩减、决策函数平滑和模型复杂度方面的问题,得到更好的鲁棒性。
Sep, 2023
本文提出了一个基于图的学习框架来训练在对抗扰动下具有稳健性的模型,并通过 Lipschitz 约束将对抗性稳健学习问题形式化为损失最小化问题,设计了一个稳健训练方案来收敛到拉格朗日函数的鞍点。 最终通过实验表明,在达到期望的标准表现的同时提高模型的稳健性存在一定的基本下限。
Jun, 2020
论文研究了预测问题和多臂老虎机问题两个具有序列决策的基本问题。特别地,我们关注当对手可能篡改损失时的随机机制,并研究能够实现的鲁棒性水平。本文的主要贡献在于表明,最佳鲁棒性可以通过对所涉及的污染量的平方根依赖来表达。此外,我们还提供了下限,表明上述遗憾边界是紧的。最后,对于多臂老虎机问题,我们还提供了一个近似紧密的下限。
Sep, 2021