Nov, 2023

用于视觉 Transformer 的高效顺序推理的令牌回收

TL;DR为了减少 Vision Transformers 的计算效率,我们引入了 TOken REcycling (TORE) 的修改,将 ViT 分为迭代器和聚合器的两部分,以便在序列化推断过程中重复使用结果,并提出了一个附加的训练策略来减少与序列决策相关的计算负担。