AAAIMar, 2022

活跃的代币混合器

TL;DR本文提出 ATMNet 模型,以 Active Token Mixer 为基础操作符,通过主动预测有用上下文的位置,并学习如何在通道级别上将这些上下文与 query token 融合,从而扩展了 token-mixing 的空间范围,提高了模型的有效性和可扩展性,实验证明 ATMNet 在各种视觉任务中均优于现有的 CNNs,Transformers 和 MLPs 等传统模型。