Mar, 2024

OSSCAR:一个用于图像和语言模型的单次结构化剪枝方法与组合优化

TL;DR本文通过结构剪枝方法在大规模视觉和语言模型中降低推理成本,提出了一种基于组合优化的框架,利用层间重构目标和低秩更新的本地组合优化算法,显著改善了先前方法在视觉模型和语言模型上的性能。