Oct, 2023

一系列矩阵乘法例程的自动生成器与 Apache TVM

TL;DR利用 Apache TVM 开源框架自动生成算法族,以获得高性能的矩阵乘法算法,并自动化生成特定处理器的微内核,提高可移植性、可维护性并简化软件生命周期,同时实现高灵活性并优化解决方案以满足不同数据类型、处理器架构和矩阵形状需求,具有较小的内存占用,性能可以与手动优化的库相媲美(对于特定的矩阵形状甚至更好)。