Mar, 2018

基于 FPGA 的混合高效卷积算法的人脸识别

TL;DR本研究通过探索多种快速卷积算法,包括Winograd和FFT,并发现了一种将它们应用于不同类型卷积的最佳策略;实现在基于高级综合的可配置IP人脸识别加速系统中使用FaceNet,并利用并行化的优化方案在新型CNN体系结构上,实现比高端NVIDIA GPU快3.75倍的延迟加速,并显著超过先前的FPGA结果。