Mar, 2024

基于梯度的黑盒显著图生成的前向学习

TL;DR我们引入了一种新的统一框架,用于在黑盒模型中估计梯度并生成显著性地图以解释模型决策。我们采用似然比方法来估计输出到输入的梯度,并利用它们来生成显著性地图。此外,我们提出了块计算技术来提高估计精度。在黑盒模型中进行的大量实验证实了我们方法的有效性,表明准确估计梯度并生成的显著性地图能够解释模型的决策。此外,我们将该方法应用于解释 GPT-Vision,展示了在大规模、闭源和黑盒模型时梯度解释方法的可伸缩性。