Mar, 2024

一点点泄漏将毁掉一艘巨舰:从头到尾的大语言模型透明度调查

TL;DR大型语言模型存在泄漏风险,可能泄漏个人信息、侵犯版权以及评估数据集,本文通过实验调查泄漏数据比例与输出速率、检测性能之间的关系,并提出了一种自检测方法,结果显示即使训练数据中含有少量泄漏数据,大型语言模型仍能产生大量的泄漏信息,而我们的自检测方法表现优于现有的方法。