Sep, 2024

科尔莫戈洛夫-阿诺德变压器

TL;DR本研究针对传统变压器中多层感知器层的限制,提出了一种新架构——科尔莫戈洛夫-阿诺德变压器(KAT),通过使用科尔莫戈洛夫-阿诺德网络(KAN)层来提高模型的表现力和性能。研究中提出的三大解决方案有效地克服了在现代硬件上实施KAN时的计算效率和权重初始化挑战,使KAT在性能上显著超越了传统基于MLP的变压器。