BriefGPT.xyz
Ask
alpha
关键词
codeattack
搜索结果 - 2
通过代码探索大型语言模型的安全泛化挑战
通过将自然语言输入转化为代码输入,CodeAttack 框架揭示了大型语言模型的安全泛化性问题,并发现了代码领域中的新安全风险,需要更健壮的安全对齐算法来匹配大型语言模型的代码功能。
PDF
4 months ago
CodeAttack:预训练编程语言模型的基于代码的对抗性攻击
CodeAttack 是一个基于代码结构的黑盒攻击模型,检测了最先进的预训练编程语言模型对特定于代码的对抗攻击的脆弱性,并成功地在不同编程语言的多个代码 - 代码和代码 - NL 任务中实现了最佳性能下降。
PDF
2 years ago
Prev
Next