虚假和LLM生成的领英档案的临近威胁：检测和预防的挑战与机遇

Jul, 2023

虚假和LLM生成的领英档案的临近威胁：检测和预防的挑战与机遇

The Looming Threat of Fake and LLM-generated LinkedIn Profiles: Challenges and Opportunities for Detection and Prevention

HTML

PDF

Navid Ayoobi, Sadat Shahriar, Arjun Mukherjee

TL;DR我们提出了一种新的方法，用于在LinkedIn在线社交网络注册和建立连接之前立即检测伪造和大型语言模型（LLM）生成的个人资料。该方法使用LinkedIn个人资料中的文本信息，并引入“Section and Subsection Tag Embedding（SSTE）”方法，以增强这些数据的区分性特征，以区分合法个人资料和由冒名顶替者手动或使用LLM创建的个人资料。我们收集了3600个LinkedIn个人资料，并将其公开用于研究目的。我们展示了该方法可以在所有词嵌入中实现约95%的准确率，可以区分合法个人资料和伪造个人资料。此外，我们还展示了SSTE对于识别由LLM生成的个人资料具有很高的准确率，即使在训练阶段没有使用LLM生成的个人资料，当训练集中添加仅20个LLM生成的个人资料时，可以实现约90%的准确率。这是一个重要的发现，因为在不久的将来将出现多种LLM，设计一个能够识别由各种LLM创建的个人资料的单一系统将变得非常具有挑战性。

Abstract

In this paper, we present a novel method for detecting fake and Large Language Model (LLM)-generated profiles in the linkedin online social network immediately upon registration and before establishing connections. Early fake profile identification is crucial to maintaining the platfor