Jul, 2024

LoRA-Guard:大型语言模型内容审核的参数高效护栏适应

TL;DRLoRA-Guard是一种参数高效的防护栏适应方法,它通过LLMs和防护模型之间的知识共享提取语言特征,并使用低秩适配器适应内容调节任务,双路径设计防止生成任务性能降低。它在保持准确性的同时,有效降低参数开销,实现了设备上的内容调节。