抗腐败的利普希茨上下文搜索

Jul, 2023

Corruption-Robust Lipschitz Contextual Search

Shiliang Zuo

TL;DR学习具有损坏二进制信号的 Lipschitz 函数的问题，采用了一种自然而强大的技术来检查算法的鲁棒性，设计了能够实现小累积损失的算法。

Abstract

I study the problem of learning a lipschitz function with corrupted binary signals. The learner tries to learn a lipschitz function $f$ that the

lipschitz function corrupted binary signals adversary cumulative loss corruption-robust algorithms

发现论文，激发创造

鲁棒利普希茨贝叶斯在对抗扰动下的决策

本文提出了第一行对抗下的强、弱 Lipschitz bandit 算法，能在无总损坏预算的情况下，在两种类型的对手下实现次线性后悔，但强对手情况下表现最优，并通过对两种经典攻击的试验证明了该算法的有效性。

May, 2023

对抗环境学习的高效算法

该论文提出了用于对抗环境下上下文相关强化学习问题的第一种 Oracle 有效的亚线性后悔算法，分析了两个场景，其中一个是传递式场景，另一个是小分离器设置

Feb, 2016

具有通用函数近似的反腐败离线强化学习

我们研究了离线强化学习中的腐败鲁棒性问题，提出了一种新的不确定性权重迭代方法来计算批处理样本，并设计了一种对腐败具有鲁棒性的离线强化学习算法。

Oct, 2023

在线和分布自由鲁棒性：带 Huber 污染的回归和上下文臂

本文从对抗鲁棒性的角度重新审视了两个经典的高维在线学习问题，即线性回归和情境地图，并探究了无需假设数据分布，直接从全局角度保证它们对抗鲁棒的可行性。具体方法是通过交替最小化策略将普通最小二乘法嵌入到简单的凸约束计算不完整数据下的最优加权分布，并证明该方法在污染程度方面具有最佳的可重复性和完整性。

Oct, 2020

具对抗性破坏的随机线性优化

将随机赌徒模型扩展到对抗性破坏模型，并应用于随机线性优化问题，采用 L"owner-John 椭球进行探索，并将时间分割成指数递增的时代以限制破坏的影响，使得算法对于适应性对手所选择的破坏的数量不可知，其遗憾只会在破坏数量线性增加时增加。

Sep, 2019

对异常数据鲁棒的回归的高效算法

本文首次给出了一个多项式时间算法，用于在示例和标签中对抗性堕落下执行线性或多项式回归，并基于 SoS 方法提出了一种自然的凸松弛方法来解决非凸优化问题。

Mar, 2018

具有弹性控制和较大利普希茨常数的认证鲁棒模型

通过校准的利普希茨边界 - 边际损失（CLL）方法，本论文针对对抗性样本、利普希茨边界和预测边际进行研究，提出了改进的鲁棒性证明，通过解决输出分布缩减、决策函数平滑和模型复杂度方面的问题，得到更好的鲁棒性。

Sep, 2023

关于局部隐私线性情境赌博机的最佳后悔

通过分析均值绝对偏差误差和分层主成分回归，我们展示了一种能够在局部隐私线性情境播放机中实现 O (√T) 累积遗憾上界的解决方案。

Apr, 2024

利普希茨界和拉普拉斯平滑法可证明的鲁棒训练

本文提出了一个基于图的学习框架来训练在对抗扰动下具有稳健性的模型，并通过 Lipschitz 约束将对抗性稳健学习问题形式化为损失最小化问题，设计了一个稳健训练方案来收敛到拉格朗日函数的鞍点。最终通过实验表明，在达到期望的标准表现的同时提高模型的稳健性存在一定的基本下限。

Jun, 2020

在线决策问题中关于对抗性破坏的最佳鲁棒性

论文研究了预测问题和多臂老虎机问题两个具有序列决策的基本问题。特别地，我们关注当对手可能篡改损失时的随机机制，并研究能够实现的鲁棒性水平。本文的主要贡献在于表明，最佳鲁棒性可以通过对所涉及的污染量的平方根依赖来表达。此外，我们还提供了下限，表明上述遗憾边界是紧的。最后，对于多臂老虎机问题，我们还提供了一个近似紧密的下限。

Sep, 2021