Oct, 2024
用于高效视觉识别的big.LITTLE视觉变换器
big.LITTLE Vision Transformer for Efficient Visual Recognition
TL;DR本文提出了一种新的架构——big.LITTLE视觉变换器,旨在解决高效视觉识别的问题。该研究通过动态推理机制,使关键token由高性能模块处理,而低价值token则由高效模块处理,从而显著降低计算负荷,同时保持模型的整体性能。实验结果表明,该架构在大规模视觉识别任务中实现了高准确性和显著的计算节省,展示了混合模型在优化计算与性能方面的潜力。