Nov, 2022

需要多个退出点:加速统一视觉语言模型的动态提前退出

TL;DR通过提出一种名为 MuE 的新颖的早期退出策略,可以在编解码器中动态地跳过图像和文本多模态的不同层,从而提高推理效率,该方法可将预期推理时间缩短 50%和 40%,同时保持高达 99%和 96%的性能。