Jul, 2023

虚假和LLM生成的领英档案的临近威胁:检测和预防的挑战与机遇

TL;DR我们提出了一种新的方法,用于在LinkedIn在线社交网络注册和建立连接之前立即检测伪造和大型语言模型(LLM)生成的个人资料。该方法使用LinkedIn个人资料中的文本信息,并引入“Section and Subsection Tag Embedding(SSTE)”方法,以增强这些数据的区分性特征,以区分合法个人资料和由冒名顶替者手动或使用LLM创建的个人资料。我们收集了3600个LinkedIn个人资料,并将其公开用于研究目的。我们展示了该方法可以在所有词嵌入中实现约95%的准确率,可以区分合法个人资料和伪造个人资料。此外,我们还展示了SSTE对于识别由LLM生成的个人资料具有很高的准确率,即使在训练阶段没有使用LLM生成的个人资料,当训练集中添加仅20个LLM生成的个人资料时,可以实现约90%的准确率。这是一个重要的发现,因为在不久的将来将出现多种LLM,设计一个能够识别由各种LLM创建的个人资料的单一系统将变得非常具有挑战性。