对推荐系统模型抽取攻击的防御

Oct, 2023

Defense Against Model Extraction Attacks on Recommender Systems

Sixiao Zhang, Hongzhi Yin, Hongxu Chen, Cheng Long

TL;DR针对推荐系统中模型提取攻击的首个防御策略是基于梯度的排名优化（GRO），通过将非可微的排名列表转化为可微的交换矩阵，该策略最小化受保护目标模型的损失并最大化攻击者代理模型的损失，实验证明其在防御模型提取攻击方面的卓越有效性。

Abstract

The robustness of recommender systems has become a prominent topic within the research community. Numerous adversarial attacks have been proposed, but most of them rely on extensive prior knowledge, such as all t

recommender systems adversarial attacks model extraction attack gradient-based ranking optimization (gro)defense strategy

发现论文，激发创造

通过无数据模型提取对顺序推荐器的黑盒攻击

本研究探讨了模型提取是否可以用于 “窃取” 顺序推荐系统的权重以及针对此类攻击对受害者可能带来的潜在威胁。我们认为，由于用于训练它们的特定自回归模型，顺序推荐系统容易受到攻击。我们在无数据访问情况下，通过有限预算模拟数据生成和知识蒸馏提出了一种基于 API 的模型提取方法，以研究最先进的顺序推荐模型在此类攻击下的脆弱性。通过两阶段攻击，即模型提取和下游攻击，我们发现黑盒顺序推荐模型易受白盒顺序推荐器生成的对抗样本干扰并受到污染。

Sep, 2021

深度排序中的对抗攻击和防御

本文提出两种针对深度排名系统的攻击，即候选攻击和查询攻击，还提出了一种反折叠三元组防御来提高排序模型的鲁棒性，并通过提出的经验鲁棒性评分来全面度量排名模型的鲁棒性，实验结果表明，我们的防御措施可以显著提高排名系统的鲁棒性，并同时缓解各种攻击。

Jun, 2021

推荐系统的模型窃取攻击

通过限制可用目标数据和查询数量，并利用与目标数据共享物品集的辅助数据，利用注意机制将它们融合起来辅助攻击，该论文设计了有效提取通过查询目标模型获得的推荐列表的窃取函数，实验结果表明该方法适用于大多数推荐系统和各种场景，并在多个数据集上表现出优异的攻击性能。

Dec, 2023

评审引入的模型无关配置注入攻击对推荐系统的影响

通过引入产品的文本评论以提高生成质量，我们提出了一种名为 R-Trojan 的新型攻击框架，将攻击目标表述为优化问题，并采用定制的基于转换器的生成对抗网络 (GAN) 进行求解，从而产生高质量的攻击性用户配置文件。在黑盒设置下对各个受害者推荐系统进行的广泛实验证明了 R-Trojan 在多个受害者推荐系统上明显优于现有最先进的攻击方法，并展示了其良好的不可察觉性。

Feb, 2024

目标检测情境下的零数据模型提取攻击

通过生成器人工策划的查询，对于第一次扩展到用于预测物体检测中的边界框坐标的回归问题的黑盒子攻击，提出了一个无数据模型提取技术，发现定义损失函数和使用新型生成器设置是提取目标模型的关键。所提出的模型提取方法通过合理的查询取得了显著的结果，该物体检测漏洞的发现将有助于未来保护这类模型的前景。

Aug, 2023

数据重构攻击和防御：系统评估

在这项工作中，我们提出了一种针对联邦学习环境中的强力重构攻击，该攻击重构了中间特征，并且与大多数先前的方法相比，集成且表现更好。我们在这种更强力的攻击上进行了深入的理论和实证研究，发现梯度剪裁是针对最先进攻击的最有效策略。

Feb, 2024

深度学习推荐系统中的数据毒化攻击

本研究针对基于深度学习的推荐系统进行了第一次系统性研究，提出了一个注入可控用户的数据污染攻击模型并发现此攻击在小、大规模数据集上都表现出色，同时提出多种优化方法用于解决此非凸整数编程问题。

Jan, 2021

如何操纵对手：梯度重定向的定向高效模型窃取防御

机器学习 API 面临盗取模型的问题，本文提出了一种名为 GRAD^2 的梯度重定向防御方法，通过优化算法、辅助网络和防御策略的改进，在保证良性用户效用的同时，实现了较小的效用损失和低计算开销，并证明了其可行性和优越性。

Jun, 2022

一种面向视觉感知推荐系统的黑盒攻击模型

该论文研究了基于图像的协同过滤推荐系统中可能存在的视觉攻击，并提出了一种新的视觉攻击模型，该模型可以有效地影响推荐系统中商品的排名，并证明了该攻击模型可以在不了解模型参数的情况下，通过对商品图像进行微小不可察觉的修改，从而提高商品的分数。

Nov, 2020

对抗性排名攻击和防御

本文提出了两种针对深度排序系统的攻击方法，即候选攻击和查询攻击，并且也提出了一种防御方法来提高排序系统的鲁棒性，我们的攻击和防御方法在 MNIST、Fashion-MNIST 和 Stanford-Online-Products 数据集中进行了评估。实验结果表明，我们的攻击可以有效地攻击典型的深度排序系统，同时使用我们的防御方法可以中等程度地提高系统的鲁棒性，此外，我们的攻击展示了可以实现黑盒攻击的可能性。

Feb, 2020