Mar, 2024
OSSCAR:一个用于图像和语言模型的单次结构化剪枝方法与组合优化
OSSCAR: One-Shot Structured Pruning in Vision and Language Models with Combinatorial Optimization
Xiang Meng, Shibal Ibrahim, Kayhan Behdin, Hussein Hazimeh, Natalia Ponomareva...
TL;DR本文通过结构剪枝方法在大规模视觉和语言模型中降低推理成本,提出了一种基于组合优化的框架,利用层间重构目标和低秩更新的本地组合优化算法,显著改善了先前方法在视觉模型和语言模型上的性能。