BriefGPT.xyz
Ask
alpha
关键词
prompt manipulation techniques
搜索结果 - 1
利用阿拉伯音译和阿拉伯数字输入赋予 LLM 释放权限
这项研究识别了大型语言模型(LLMs)对 “越狱” 攻击的潜在漏洞,特别关注阿拉伯语及其不同形式。我们的调查拓宽了研究范围,探究了阿拉伯语言。我们最初在标准阿拉伯语上测试了 AdvBench 基准测试,发现即使采用前缀注入等提示操纵技术,也
→
PDF
14 days ago
Prev
Next