May, 2024

ProFLingo:一种基于指纹技术的大型语言模型版权保护方案

TL;DR本文提出了一种基于黑盒指纹识别的版权保护方案,称为 ProFLingo,它能够生成可以代表原始模型独特决策边界特征的对抗性样本,从而建立独特的指纹。该方案通过检验这些对抗性样本在嫌疑模型上的有效性来确定是否来源于原始模型,采用非侵入式方法,既不需要对嫌疑模型的了解,也不需要对基础模型或其训练过程进行修改。据我们所知,我们的方法是针对 LLMs 的第一个黑盒指纹识别技术。