BriefGPT.xyz
大模型
Ask
alpha
关键词
safeguarding
搜索结果 - 2
AI 代理面临威胁:主要安全挑战与未来发展路径调查
通过系统地审查人工智能代理所面临的安全威胁,本文突出了在保护人工智能代理方面所取得的进展和现有的限制,并旨在激发进一步研究以解决与人工智能代理相关的安全威胁,从而促进更加稳固和安全的人工智能代理应用程序的发展。
PDF
a month ago
可学习的语言水印:对大型语言模型的模型提取攻击进行追踪
在快速发展的人工智能领域中,保护大型语言模型(LLMs)的知识产权变得越来越关键。我们提出了一种新颖的方法,在 LLMs 中嵌入可学习的语言水印,以追踪和防止模型提取攻击。我们的方法通过向令牌频率分布中引入可控噪声来微妙地修改 LLM 的输
→
PDF
2 months ago
Prev
Next