BriefGPT.xyz
Ask
alpha
关键词
multi-turn dialogue coreference
搜索结果 - 1
EMNLP
CoSafe:评估多轮对话中大型语言模型安全性的共指
LLM 对话共指中的安全性漏洞研究,包括创建了一个包含 1,400 个问题的数据集,并在五种常用的开源 LLM 模型上进行了评估,结果表明在多轮共指安全攻击下,LLaMA2-Chat-7b 模型具有最高的攻击成功率为 56%,而 Mistr
→
PDF
11 days ago
Prev
Next