Jan, 2025

JAQ:硬件-软件共同探索下的联合高效架构设计与低比特量化

TL;DR本研究针对在资源受限的边缘设备上实现神经网络架构、量化精度与硬件加速器的有效联合设计这一难题,提出了JAQ框架。JAQ通过通道稀疏量化方案和BatchTile方法,成功减少了内存开销并加速了硬件搜索,实验显示其在ImageNet上的Top-1准确率提高了约7%,并将每次迭代的硬件搜索时间降至0.15秒。