Oct, 2023

对推荐系统模型抽取攻击的防御

TL;DR针对推荐系统中模型提取攻击的首个防御策略是基于梯度的排名优化(GRO),通过将非可微的排名列表转化为可微的交换矩阵,该策略最小化受保护目标模型的损失并最大化攻击者代理模型的损失,实验证明其在防御模型提取攻击方面的卓越有效性。