Mar, 2024

用大型语言模型在npm生态系统中检测恶意软件

TL;DR通过大型语言模型的实证研究,我们提出了SocketAI Scanner,使用迭代自我完善和零-shot角色扮演Thought (CoT)提示技术的多阶段决策器恶意软件检测工作流,来协助安全分析人员在npm生态系统中检测潜在的恶意软件。我们的研究结果表明,GPT模型在误报率低的情况下具有良好的性能,对静态分析工具的基准比较显示出明显的改进。GPT-3模型的精确度和F1得分分别达到了91%和94%,而GPT-4模型在精确度(99%)和F1得分(97%)方面表现出卓越的性能。