Jan, 2024

Malla: 破解现实世界中大型语言模型集成恶意服务

TL;DR通过对 212 个真实世界 Malla 的研究,我们揭示了地下市场中 Malla 的快速增长和对当今公共 LLM 服务的影响,发现了 Malla 生态系统并暴露了它们的运作方式,包括 8 个后端 LLM 和 182 个绕过公共 LLM API 保护措施的提示,同时解密了 Malla 所采用的战术,如滥用未经审查的 LLM 和通过越狱提示利用公共 LLM API。我们的研究有助于更好地了解网络犯罪分子对 LLM 的实际利用,并为应对这种网络犯罪提供策略洞察。