Aug, 2023

LGViT:动态早期退出以加速视觉Transformer

TL;DR我们提出了一种早期退出的通用ViTs框架LGViT,它通过引入异质退出头,包括局部感知头和全局聚合头,实现了效率和准确性的权衡,通过两阶段的训练方案,包括端到端训练和带有冻结骨干的自蒸馏,生成了早期退出的ViTs,进一步促进了由这两种类型的头提取的全局和局部信息的融合,实验证明我们的LGViT能够在大约1.8倍的速度提升的同时保持竞争力的性能。