Mar, 2024
NiNformer:一种带有令牌混合生成门控函数的网络中网络 Transformer
NiNformer: A Network in Network Transformer with Token Mixing Generated Gating Function
Abdullah Nazhat Abdullah, Tarkan Aydin
TL;DR该论文介绍了一种用于减少计算负担的新的计算模块,通过替换标准的注意力层为具有动态学习元素级门控函数的网络结构,增强了 MLP Mixer 的静态方法,从而在图像分类任务中比基准架构表现更好。