Nov, 2023

维度混合器:深度神经网络中结构稀疏性的通用方法

TL;DR研究了多个神经架构之间的相似性和差异性,通过对耦合流与蝴蝶变换的研究,提出了非线性蝴蝶混合器,包括 Butterfly MLP 和 Butterfly Attention,证明了它们在处理不同维度的输入上的高效性和可扩展性。