Nov, 2023

通过自提示校准对精调大型语言模型进行实用的成员推断攻击

TL;DR基于自校准概率变异的成员推断攻击(SPV-MIA)提出了一种新的对严格微调但无过拟合和隐私保护的 LLMs 泄露隐私的成员推断攻击方法。