BriefGPT.xyz
Ask
alpha
关键词
post hoc explanation methods
搜索结果 - 4
Self-AMPLIFY: 提高小型语言模型性能的自解释方法
自动化方法 Self-AMPLIFY 将事后解释方法应用于小型语言模型,生成有理性解释并改善其性能。
PDF
5 months ago
可验证特征归因:后解释性与内在可解释性之间的桥梁
通过 VerT 方法,将黑盒模型转化为生成可信且可验证特征归因的模型,从而弥合了先前研究中的解释策略差距。
PDF
a year ago
OpenXAI:朝向机器学习模型解释的透明化评估
介绍了 OpenXAI—— 一种全面的且可扩展的开源框架,用于评估和基准测试事后解释方法。 OpenXAI 包括一个灵活的合成数据生成器和各种真实世界数据集,预先训练的模型和最先进的特征归因方法的集合,以及评估解释方法准确性、稳定性和公平性
→
PDF
2 years ago
可解释机器学习中的异议问题:从从业者角度的看法
通过研究解释性机器学习中的不一致性问题,本文介绍了一种定量框架来形式化不同解释方法生成的解释之间的不一致性,并通过萨实证分析和在线调查了解了数据科学家如何解决这些分歧。结果表明,当今最先进的解释方法在生成解释方面经常存在分歧,强调了开发原则
→
PDF
2 years ago
Prev
Next