May, 2024

基于连接的 CNN 架构的迭代滤波剪枝

TL;DR基于模型压缩和硬件加速,本研究通过剪枝方法对高度互联的卷积层的连接汇如 YOLOv7 中进行处理,并通过迭代敏感度分析、剪枝和模型微调,显著减少了模型大小,同时保持了可比较的模型准确性。最终将剪枝模型部署到 FPGA 和 NVIDIA Jetson Xavier AGX 上,与未剪枝的模型相比,在卷积层中实现了 2 倍的加速,并在 FPGA 上达到了每秒 14 帧的实时能力。