Oct, 2023

高效计算的神经网络评分

TL;DR通过引入一个复合分数来衡量精确度和功耗在神经网络推断过程中的权衡,本文提出了一个新的开源工具,使研究人员能够考虑更多的指标,包括细粒度的功耗、RAM/CPU/GPU利用率,以及存储和网络的输入/输出。该方法被用于探索神经网络的能耗和精确度之间的折衷,同时也有助于对比两种架构,以更准确地适配硬件和进行架构探索。