Apr, 2024

Arena: 对边缘辅助视频分析的感兴趣区域可见光成像推断加速系统

TL;DR通过引入 Arena,基于 Vision Transformer(ViT)的端到端边缘辅助视频推理加速系统,利用 ViT 的能力通过令牌修剪加速,仅将感兴趣区域(PoIs)卸载并传递给下游模型,还使用基于概率的补丁抽样确定连续帧中对象的可能位置,通过在公共数据集上广泛评估,结果表明 Arena 可以提高推理速度达到平均 1.58 倍和 1.82 倍,同时只消耗带宽的 54% 和 34%,而推理准确性也很高。