Apr, 2025

机器学习中的缓解与检测的密码学视角

TL;DR本研究探讨了机器学习算法在推理过程中对抗性输入的检测与缓解之间的理论关系,定义了“检测防御”(DbD)和“缓解防御”(DbM)。主要发现是,对于生成学习任务,二者存在明显差异,某些情况下只能通过缓解实现防御,且在缓解阶段使用的样本显著少于初始训练算法。