Jul, 2021

模型提取攻击的有状态检测

TL;DR本研究提出 VarDetect,一个可用于追踪 API 用户查询分布并检测模型提取攻击的有状态监视器。VarDetect 使用经过改进的变分自编码器学习潜在的查询分布并可有效地检测三种类型的攻击者样本。此外,VarDetect 也能被部署为自动防御机制,进一步保护机器学习模型不被攻击者提取。