ICMLJul, 2023

基于查询的黑盒攻击下具有状态的防御的理论权衡

TL;DR机器学习系统面临着对抗性示例的威胁,尽管在受限的黑盒条件下攻击成功率令人担忧。本研究旨在对有状态防御进行理论描述,提供了攻击检测和假阳性率之间的权衡的上限,并分析了特征提取器 / 底层问题域的性质对此权衡的影响。通过在多个数据集和有状态防御上进行实证评估,支撑了我们的理论发现。