Sep, 2023

神经图像压缩的带宽有效推理

TL;DR我们提出了一种端到端可微分的带宽高效神经推理方法,通过神经数据压缩方法对激活进行压缩,可实现高达 19 倍的带宽减少和 6.21 倍的能量节省。