BriefGPT.xyz
大模型
Ask
alpha
关键词
black-box prompt optimization
搜索结果 - 2
羊驼对抗维昆纳:利用 LLMs 揭示 LLMs 的记忆
我们介绍了一种黑盒提示优化方法,利用攻击者 LLM 代理来揭示受害者代理中比直接使用训练数据作为提示目标模型所揭示的更高水平的记忆,我们使用迭代的拒绝抽样优化过程来找到具有两个主要特征的基于指令的提示,即 (1) 最小程度地与训练数据重叠,
→
PDF
4 months ago
黑盒提示优化:无需模型训练对齐大型语言模型
通过黑盒提示优化(BPO)进行对齐,使得大型语言模型(LLMs)更好地遵循用户指令,以最佳方式实现用户意图,而无需更新 LLMs 的参数,并且 BPO 对齐的 ChatGPT 在胜率上比原始版本提高了 22%,GPT-4 提高了 10%。
PDF
8 months ago
Prev
Next