BriefGPT.xyz
Ask
alpha
关键词
safety features
搜索结果 - 2
ICLR
LLM 能将指令与数据分离吗?我们用这个说法究竟是什么意思?
我们介绍了一种量化指令和数据分离现象的形式化测量方法,以及可以从模型的黑盒输出计算的经验性变量。我们还引入了一个名为 SEP(应该执行还是处理?)的新数据集,并对几种最先进的开源和闭源大语言模型进行了测试。最后,我们定量证明所有评估的大语言
→
PDF
4 months ago
基于深度学习的自适应巡航控制的实验安全性分析:上下文感知攻击
该研究评估了基于深度神经网络的自适应巡航控制系统在感知攻击下的安全性,通过注入摄像头数据扰动以引发前方碰撞,提出了一种基于知识和数据的结合方法,设计了一种上下文感知策略来选择攻击触发的最关键时间,并提出了一种实时自适应生成图像扰动的优化方法
→
PDF
a year ago
Prev
Next