Jun, 2024

视可知:针对检索增强生成的黑盒成员推断攻击

TL;DR利用黑盒 API 访问,使用成员推理攻击的方法来确定一份样本是否属于一个 Retrieval-Augmented Generation(RAG)系统的知识数据库,并通过计算余弦相似度和模型的困惑度建立成员评分,提出了两种新的攻击策略:基于阈值的攻击和基于机器学习的攻击。