May, 2024
基于连接的CNN架构的迭代滤波剪枝
Iterative Filter Pruning for Concatenation-based CNN Architectures
TL;DR基于模型压缩和硬件加速,本研究通过剪枝方法对高度互联的卷积层的连接汇如YOLOv7中进行处理,并通过迭代敏感度分析、剪枝和模型微调,显著减少了模型大小,同时保持了可比较的模型准确性。最终将剪枝模型部署到FPGA和NVIDIA Jetson Xavier AGX上,与未剪枝的模型相比,在卷积层中实现了2倍的加速,并在FPGA上达到了每秒14帧的实时能力。