BriefGPT.xyz
大模型
Ask
alpha
关键词
prompt injections
搜索结果 - 2
指令层次结构:训练 LLMs 优先处理特权指令
今天的 LLMs 容易受到即时注入、越狱和其他攻击的影响,使得恶意提示可以覆盖模型的初始指令。本文提出一种指令层次结构,明确定义了在不同优先级指令冲突时模型应该如何行为,并提出了一种数据生成方法来展示这种层次指令遵循行为,教导 LLMs 有
→
PDF
2 months ago
大型语言模型上的早期提示注入攻击分类
大语言模型和 AI 聊天机器人在使人工智能民主化方面处于前沿。然而,发布 ChatGPT 和其他类似工具后,人们越来越担心难以控制大语言模型及其输出的问题。目前,我们正目睹用户试图滥用这些模型而开展的一场猫鼠大战,新出现了一种名为提示注入的
→
PDF
5 months ago
Prev
Next