ECCVApr, 2021
嵌入式推理加速器硬件架构及深度卷积和大核卷积算法分析
Hardware Architecture of Embedded Inference Accelerator and Analysis of Algorithms for Depthwise and Large-Kernel Convolutions
Tse-Wei Chen, Wei Tao, Deyu Wang, Dongchao Wen, Kinya Osa...
TL;DR该论文提出了一种硬件架构,以高灵活性处理深度卷积和常规卷积,支持不同大小的卷积核,具有比相关工作更快的速度和更少的计算和模型大小。此外,DDC 层的使用可以减少计算成本和模型大小,并提高准确性。