Jun, 2020
用于粒子探测器边缘低延迟推断的深度神经网络自动异构量化
Automatic heterogeneous quantization of deep neural networks for low-latency inference on the edge for particle detectors
Claudionor N. Coelho Jr., Aki Kuusela, Shan Li, Hao Zhuang, Thea Aarrestad...
TL;DR本文介绍了一种利用分层、分参数类型的自动量化过程来设计深度神经网络模型的方法,旨在使模型能够在芯片上进行高精度、纳秒级推理和完全自动化部署。这对于 CERN 大型强子对撞机中的事件选择过程至关重要,其中资源严格限制,需要一种纳秒级的推理和降低 50 倍的资源消耗。