Jan, 2025

卡拉茨巴矩阵乘法及其高效定制硬件实现

TL;DR本研究解决了大型整数乘法中卡拉茨巴算法在小整数乘法中效益减低的问题。我们提出将标量卡拉茨巴乘法算法扩展到矩阵乘法,并设计了高效的硬件架构以实现这一扩展,显著降低了额外加法的复杂度。研究表明,所提出的算法和硬件架构在矩阵乘法中相较于传统方法提供了更好的面积和执行时间效率,这对深度学习加速器系统的性能提升具有重要意义。