Apr, 2024

关于标记数据和符号方法在隐藏神经元激活分析中的价值

TL;DR通过解释隐藏神经元的激活来理解可解释人工智能是一个重要的挑战:准确的解释有助于回答深度学习系统内部检测输入中什么是相关的问题,揭示深度学习系统原本的黑盒特性。该论文介绍了一种新颖的与模型无关的可解释人工智能方法,通过使用约 200 万个类别的维基百科派生的概念层次结构作为背景知识,并利用 OWL 推理进行解释生成。研究结果表明,该方法在定量和定性方面与先前的方法相比,为密集层的个别神经元自动添加有意义的类别表达式作为解释,具有竞争优势。