Apr, 2024

隐藏的协同作用:$L_1$ 权重归一化与 1 - 路径 - 范数正则化

TL;DR提出了一种名为 PSiLON Net 的 MLP 架构,利用 $L_1$ 权重归一化来处理每个权重向量,并在层间共享长度参数。通过简化 1-path-norm 并提供对高效学习和近稀疏参数的归纳偏差,设计了 PSiLON Net。同时,提出了一种修剪方法来在最后阶段实现精确稀疏性。使用改进的 1-path-norm 作为正则化器,针对小数据环境下过参数化的 PSiLON Nets 和 PSiLON ResNets 进行实验,展示了可靠的优化和强大的性能。