BriefGPT.xyz
Apr, 2025
人工智能可解释性的极限:一种算法信息理论方法
The Limits of AI Explainability: An Algorithmic Information Theory Approach
HTML
PDF
Shrisha Rao
TL;DR
本研究通过算法信息理论建立了理解人工智能可解释性基本极限的理论基础。我们将可解释性形式化为复杂模型与简单模型的近似,并量化近似误差和解释复杂性。研究结果显示,任何显著简化的解释必将在某些输入上与原模型不同,且解释复杂性随输入维度呈指数增长,这些发现对可解释人工智能系统的设计和监管具有重要影响。
Abstract
This paper establishes a theoretical foundation for understanding the fundamental limits of
AI Explainability
through
Algorithmic Information Theory
. We formalize explainability as the approximation of complex mo
→