MMJul, 2018

CascadeCNN:将量化在卷积神经网络中的性能极限推至极致

TL;DRCascadeCNN 是一个自动化工具流程,用于推动任何给定的 CNN 模型的量化极限,旨在进行高吞吐率推理。通过在级联中使用低 - 高精度单元以及置信度评估单元,实现对任何给定的 CNN-FPGA 配对的定制。实验证明,所提出的工具流程在相同的资源预算和准确性下,可以使 VGG-16 的性能提升高达 55%,AlexNet 的性能提升高达 48%,而无需重新训练模型或访问训练数据。