EMNLPOct, 2023

MeaeQ:高效查询挂载模型抽取攻击

TL;DR我们提出了 MeaeQ(具有高效查询的模型提取攻击),一种简单而有效的方法来解决自然语言处理(NLP)中的模型提取攻击问题。通过结合 API 服务信息,我们利用零样本序列推理分类器从公共文本语料库中过滤任务相关数据,而不是使用问题特定领域的数据集。此外,我们使用基于聚类的数据减少技术来获取攻击的查询的代表性数据。我们在四个基准数据集上进行的大量实验证明,MeaeQ 在需要更少查询的同时,与受攻击模型具有更高的功能相似性。