May, 2024

大规模知识洗涤

TL;DR在大规模语言模型中,我们介绍 Large Scale Washing(LAW)方法,通过更新解码器中的 MLP 层进行知识净化,从而忘记目标知识并保持推理能力。