Oct, 2023

用勺子挖空海洋:我们应该编辑模型吗?

TL;DR质疑直接模型编辑方法在修正LLM生成的事实错误方面的有效性,提出与其类似但不同的三种方法:基于检索的体系结构、概念擦除方法和归因方法,认为直接模型编辑不能作为LLMs内在缺陷的系统性疗法,尽管在提高模型可解释性方面具有潜力,但通过强调模型的可信性而带来风险,呼吁谨慎推广和应用模型编辑作为LLM部署过程的一部分,并负责任地将LLMs的用例限制在不依赖编辑作为关键组成部分的情况下。