BriefGPT.xyz
Ask
alpha
关键词
cipher
搜索结果 - 2
让模型发表言论:通过嵌入进行多智能体辩论
通过引入名为 CIPHER 的通信机制,本文通过使用嵌入表示的期望而不是自然语言的方式,无需修改模型权重即可将更广泛的信息编码进大型语言模型之间的通信,实验证明 CIPHER 辩论方法在多项推理任务中取得了相对于传统推理方法 1-3.5%
→
PDF
9 months ago
GPT-4 太聪明了,不安全:通过密码与 LLMs 进行隐秘聊天
通过 CipherChat 框架评估 ChatGPT 和 GPT-4,发现某些密码能够在多个安全领域中以近乎 100% 的成功率绕过 GPT-4 的安全对齐,证明了开发非自然语言安全对齐的必要性,同时提出了一种新颖的 SelfCipher
→
PDF
a year ago
Prev
Next