Feb, 2024

黑盒大型语言模型的知识编辑

TL;DR当前研究主要关注白盒大语言模型(LLMs)编辑,忽略了一个重要的场景:黑盒 LLMs 编辑,其中 LLMs 通过接口进行访问,仅有文本输出可用。为了解决现有评估不适用于黑盒 LLMs 编辑且不具备全面性的局限性,我们提出了一个多角度评估框架,首次加入了风格保留的评估。为了解决当前方法中的编辑数据隐私泄露和过度编辑风格的问题,我们引入了一种新的 postEdit 框架,通过下游后处理解决隐私问题,并通过细粒度编辑保持文本风格一致。两个基准实验和分析表明,postEdit 超过了所有对比基准并实现了强大的泛化性能,特别是在风格保留上获得了巨大的提升(平均提高了 20.82%)。