Dec, 2023

计算 - 内存:什么、何时、何处

TL;DR本文研究了在机器学习推断中将计算内存 (Compute-in-memory, CiM) 技术集成的问题,并通过实验证明了使用 CiM 架构可以提高能源效率,达到低至以 INT-8 精度 0.12 倍能源消耗和重复权重交错技术下最高 4 倍的性能增益,同时提供了关于何种类型 CiM 适合使用以及何时何地最佳集成于缓存层级进行 GEMM 加速的见解。