Mar, 2025
我的文本在你的AI模型中吗?基于梯度的成员推断测试应用于大型语言模型
Is My Text in Your AI Model? Gradient-based Membership Inference Test
applied to LLMs
TL;DR本研究针对基于大型语言模型的文本分类任务,采用并研究了基于梯度的成员推断测试(gMINT),解决了日益严重的数据隐私问题。通过对七种基于变换器的模型和六个包含超过250万句的文本数据集进行评估,结果表明gMINT在模型审计中具有99%的AUC得分,展示了其作为一款可扩展且可靠的工具的潜力,以确保透明性并保护敏感数据。