Apr, 2024

LLMs 在 Web 开发中:评估 LLM 生成的 PHP 代码揭示的漏洞和局限性

TL;DR该研究通过分析一组包含 2,500 个小型动态 PHP 网站的数据集,全面检查了大型语言模型生成的 Web 应用程序代码安全性。评估了这些部署为独立网站的人工智能生成网站中的安全漏洞,并采用了 Burp Suite 主动扫描器、静态分析和手动检查的混合方法。研究重点在于识别和分析文件上传、SQL 注入、存储型 XSS 和反射型 XSS。该研究不仅凸显了 AI 生成的 PHP 代码存在的潜在安全缺陷,还对在实际场景中部署此类代码的可靠性和安全性问题提出了批判性观点。该研究确认了 27% 的由 GPT-4 生成的程序在 PHP 代码中存在漏洞,并且这个数字可能更高,这对软件的安全性构成了重大风险。为了为研究界做出贡献并促进进一步的分析,我们公开了源代码,并列举了每个样本检测到的漏洞。该研究不仅揭示了 AI 生成代码的安全方面,也强调了对此类技术进行严格测试和评估的迫切性。