Mar, 2024

通过知识编辑对大型语言模型进行毒素清除

TL;DR使用知识编辑技术解毒大型语言模型,并提出了一种简单而有效的基线方法,减小了毒性参数的影响并进行了内部机制的深度分析,为未来的解毒方法和语言模型的知识机制提供了启示。