ICLRMay, 2024
模型大小对通过 LIME 解释 LLM 的影响
The Effect of Model Size on LLM Post-hoc Explainability via LIME
Henning Heyen, Amy Widdicombe, Noah Y. Siegel, Maria Perez-Ortiz, Philip Treleaven
TL;DR通过对四个不同尺寸的 DeBERTaV3 模型在自然语言推理和零样本分类任务上的 LIME 解释进行评估,发现模型尺寸的增加并不与合理性相关,尽管模型性能有所提高,这表明随着模型尺寸的增加,LIME 解释与模型内部过程之间存在不一致。我们的结果进一步指出在自然语言推理环境中对于准确性度量的限制。