Aug, 2024

变换器中的模块化:神经元可分离性与专业化研究

TL;DR本文探讨了变换器结构中神经元的模块化和任务专业化,旨在填补对变换器内部机制的理解空白。通过选择性裁剪和MoEfication聚类技术,分析了神经元在不同任务和数据子集中的重叠和专业化情况,发现存在任务特定的神经元簇,这为提升模型的可解释性和效率提供了新的视角。