Oct, 2024

内部可解释性电路发现的计算复杂性

TL;DR该研究针对神经网络内部可解释性中的电路发现问题,填补了理论和算法选项之间的空白。作者提出了一个全面的查询框架,并分析了多层感知器中查询的复杂性,揭示了许多查询的不可解性和近似性限制。研究为理解可解释性查询的范围和局限性提供了新视角,进而促进实现更有效的算法选择。