BriefGPT.xyz
Ask
alpha
关键词
post hoc explanations
搜索结果 - 4
用于比较解释模型的概率 Lipschitzness 和稳定秩
该研究论文探讨了可解释性模型中概率 Lipschitz 性以及稳定秩与神经网络的关联,并提出了一种新的指标,正则灵巧度,用于比较可解释性模型的稳健性。研究还揭示了稳定秩与可解释性模型的稳健性之间的关联。
PDF
4 months ago
后验解释能够提高语言模型的性能
AMPLIFY 框架使用后续解释的方法,自动生成自然语言解释以提供纠正信号,从而提高 Large Language Models 的预测准确率。
PDF
a year ago
KDD
S-LIME: 模型解释的稳定化 LIME
研究黑盒机器学习模型的解释方法,提出一种基于中心极限定理的假设测试框架方法,名为 S-LIME,以保证解释结果的稳定性,实验结果在模拟和真实数据集上表明该方法的有效性。
PDF
3 years ago
强健稳定的黑盒解释
通过敌对训练的方法,我们提出了一个生成稳健且高保真黑盒模型解释的新框架,尝试解决现有算法在受到分布偏移时缺乏稳定性和鲁棒性的问题,本文是首次尝试生成对一类有实际意义的敌对扰动具有鲁棒性的后续解释,实验发现我们的方法显著提高了解释的鲁棒性,而
→
PDF
4 years ago
Prev
Next