Mar, 2023

在可解释因果变量和分布式神经表示之间找到对齐

TL;DR本文介绍了一种名为分布式对齐搜索(DAS)的方法,它使用梯度下降来找出高层和低层模型之间的对齐,并允许单个神经元在非标准基中扮演多个不同的角色,从而发现了其他方法所错过的内在结构,为进行因果抽象分析消除了前期的限制。