Jul, 2024

超越困惑:LLM 压缩的多维安全评估

TL;DR本研究通过对大型语言模型进行压缩,并从四个方面考察了压缩对模型行为的影响,包括退化伤害、表征伤害、方言偏差和语言建模及下游任务性能。研究结果发现,压缩可能对模型的行为产生意想不到的后果,强调将安全评估纳入到压缩模型的开发中以确保其在现实应用中的可靠性。