Jun, 2024

garak: 大型语言模型安全探测框架

TL;DR介绍了一种名为 garak 的框架,可以发现和识别目标大型语言模型或对话系统中的漏洞,从而为漏洞在不同背景下的构成、LLM 部署的对齐和政策讨论等提供了有根据的讨论。