May, 2024

MoGU: 提升开源 LLM 安全性并保持其可用性的框架

TL;DR我们通过引入 MoGU 框架,将基础大型语言模型 (LLMs) 转化为可用 LLM 和安全 LLM 两个变体,并进一步采用动态路由来平衡它们的贡献,从而增强 LLMs 的安全性,同时保留其可用性。我们的实验结果验证了 MoGU 框架的卓越性,并证明我们设计的路由机制能够通过分配权重有效平衡每个变体的贡献。