Jun, 2024

SecureNet: DeBERTa 与大型语言模型在钓鱼检测中的比较研究

TL;DR本研究探讨了大型语言模型(LLMs)在特定任务(如文本分类,特别是检测恶意内容)中的潜力和局限,并将其结果与最先进的 DeBERTa V3 模型进行对比。通过使用包括电子邮件、HTML、URL、短信和合成数据生成的综合公共数据集,我们系统地评估了这两种方法的潜力和局限,并展示了 LLMs 如何生成具有说服力的网络钓鱼邮件以及在此背景下两种模型的性能。我们的实验结果表明,基于变形金刚的 DeBERTa 方法是最有效的,其测试数据集(HuggingFace 网络钓鱼数据集)召回率(敏感性)达到 95.17%,紧随其后的是 GPT-4,召回率为 91.04%。通过我们的研究,我们提供了这些先进语言模型的有效性和稳定性的有价值的见解,并提供了详细的比较分析,以指导未来在加强检测和减轻网络钓鱼威胁方面的研究工作。