Mar, 2022

HyperMixer:基于 MLP 的绿色 AI 替代 Transformer

TL;DR本文提出 HyperMixer 模型,通过使用超网络动态形成令牌混合 MLP 实现自然语言理解,相比于现有的 MLP-based 模型和 Transformer,在处理时间、训练数据和超参数调整方面具有更低的成本,并在实证中表现更好。