Oct, 2024

HarmAug:安全守护模型知识蒸馏的有效数据增强

TL;DR本研究解决了现有安全守护模型因参数过多而导致在移动设备上的不实用性问题。提出了HarmAug,一种简单有效的数据增强方法,利用大型语言模型生成有害指令,显著提高了小型安全守护模型的表现,其效果与甚至超越了大型模型,同时计算成本不到后者的25%。