BriefGPT.xyz
大模型
Ask
alpha
关键词
eraser
搜索结果 - 2
Eraser: 大语言模型中逆向防御通过遗忘有害知识
本文介绍了一种名为 Eraser 的新型防御方法,它能够有效减少各种攻击对模型的越狱成功率,而不影响模型的一般能力。
PDF
3 months ago
ACL
QueryAgent: 一个基于环境反馈的可靠高效推理框架
使用大型语言模型(LLMs)进行语义解析已经取得了显著的成功。本论文提出了一种名为 QueryAgent 的框架,通过逐步解决问题和进行自我纠正来解决可靠性和效率不足的问题。通过利用丰富的环境反馈,ERASER 方法在中间步骤中仅在必要时进
→
PDF
4 months ago
Prev
Next