BriefGPT.xyz
Ask
alpha
关键词
prompt automatic iterative refinement (pair)
搜索结果 - 1
二十次查询中破解黑盒大型语言模型
大型语言模型对人类价值观的符合日益受到关注。我们提出了 Prompt Automatic Iterative Refinement (PAIR) 算法,用于生成黑盒访问的语义越狱,以理解固有弱点并防止未来滥用。PAIR 支持自动生成越狱攻击
→
PDF
9 months ago
Prev
Next