Sep, 2023

大型语言模型的可解释性概述

TL;DR对大型语言模型的解释技术进行分类和总结,并讨论了这些技术在训练范式、生成局部解释和全局解释方面的应用以及评估指标、调试模型和提高性能的挑战和机会。