BriefGPT.xyz
Oct, 2024
内部可解释性电路发现的计算复杂性
The Computational Complexity of Circuit Discovery for Inner Interpretability
HTML
PDF
Federico Adolfi, Martina G. Vilas, Todd Wareham
TL;DR
该研究针对神经网络内部可解释性中的电路发现问题,填补了理论和算法选项之间的空白。作者提出了一个全面的查询框架,并分析了多层感知器中查询的复杂性,揭示了许多查询的不可解性和近似性限制。研究为理解可解释性查询的范围和局限性提供了新视角,进而促进实现更有效的算法选择。
Abstract
Many proposed applications of
Neural Networks
in machine learning, cognitive/brain science, and society hinge on the feasibility of
Inner Interpretability
via
→