Feb, 2022
视觉 Transformer 中的标记合并学习
Learning to Merge Tokens in Vision Transformers
Cedric Renggli, André Susano Pinto, Neil Houlsby, Basil Mustafa, Joan Puigcerver...
TL;DR本文介绍了一种减少 Transformers 计算代价的方法 —— 使用 PatchMerger 模块将网络处理的补丁或令牌数量缩减,从而在不影响性能的情况下实现了显著的加速。