BriefGPT.xyz
大模型
Ask
alpha
关键词
instruction-based prompts
搜索结果 - 3
羊驼对抗维昆纳:利用 LLMs 揭示 LLMs 的记忆
我们介绍了一种黑盒提示优化方法,利用攻击者 LLM 代理来揭示受害者代理中比直接使用训练数据作为提示目标模型所揭示的更高水平的记忆,我们使用迭代的拒绝抽样优化过程来找到具有两个主要特征的基于指令的提示,即 (1) 最小程度地与训练数据重叠,
→
PDF
4 months ago
CRISPR:从指令跟踪语言模型中消除偏置神经元
该研究介绍了一种用于减轻大型语言模型中指令 - 标签偏见的新的偏见缓解方法,称为 CRISPR,该方法利用属性方法识别有影响的偏见神经元并通过修剪来消除这些偏见神经元。实验结果表明,CRISPR 在减轻指令 - 标签偏见方面非常有效,在社交
→
PDF
8 months ago
批量提示:以更少的操作实现更多
這篇論文介紹了一種新的提示策略 ——BatchPrompt,以增強語言模型的效能,並通過 Self-reflection-guided EArly Stopping 來減少額外的 token 使用。
PDF
10 months ago
Prev
Next