May, 2024

Torch2Chip: 用于原型硬件加速器设计的端到端可定制的深度神经网络压缩和部署工具包

TL;DR通过自定义的模型压缩算法实现量化,从而加速在低功耗硬件上进行昂贵的深度神经网络计算的开源工具 Torch2Chip。