Jun, 2024

ReLU-KAN: 仅需矩阵加法、点乘和 ReLU 的新型 Kolmogorov-Arnold 网络

TL;DR该论文介绍了一种新颖的 ReLU-KAN 实现,通过采用 ReLU 和逐元素乘法简化了 KAN 的基函数设计,并优化了计算过程,提高了 CUDA 计算的效率。实验结果表明,与传统的 KAN 相比,ReLU-KAN 在具有 4 层网络的情况下加速了 20 倍。此外,ReLU-KAN 在保留了 KAN 的 “防止灾难性遗忘” 特性的同时,表现出更稳定的训练过程和较好的拟合能力。