Jun, 2024
视可知:针对检索增强生成的黑盒成员推断攻击
Seeing Is Believing: Black-Box Membership Inference Attacks Against
Retrieval Augmented Generation
TL;DR利用黑盒API访问,使用成员推理攻击的方法来确定一份样本是否属于一个Retrieval-Augmented Generation(RAG)系统的知识数据库,并通过计算余弦相似度和模型的困惑度建立成员评分,提出了两种新的攻击策略:基于阈值的攻击和基于机器学习的攻击。