BriefGPT.xyz
Ask
alpha
关键词
autoregressive nature
搜索结果 - 3
利用多轮互动增强上下文的越狱攻击
大型语言模型对越狱攻击很容易受到攻击,本研究提出了一种基于上下文互动的攻击形式,通过操作模型的回应引导其透露有害信息。在四个不同的大型语言模型上进行实验证明了该攻击的有效性,并且该攻击可以在不同大型语言模型之间转移。
PDF
5 months ago
用于推理高效 LLMs 的串联变压器
使用 Tandem transformers 架构,通过将小型自回归模型与以块模式操作的大型模型结合,以提高预测准确性并加快推理速度。在预训练数据集上,Tandem 模型显示出对下一个标记预测准确性的 3.3%改进,相比于性能相当的 PaL
→
PDF
5 months ago
ACL
BOLT:快速能量驱动的文本生成,具有可调节偏差
本文提出了一种名为 BOLT 的生成模型,在语言模型的输出 logits 直接调整的基础上,通过维护自回归性质和关注 token 级的条件依赖关系和整体流畅性来加强对文字生成的控制,优于竞争基准模型,其在情感控制上的速度比竞争基准快 7 倍
→
PDF
a year ago
Prev
Next