May, 2023

AMULET: 自适应矩阵乘法任务

TL;DRAmulet 框架使用数据库和编译器优化技术来生成适合于特定执行环境的快速代码,相对于现有编译器,Amulet 在各种矩阵乘法任务上都获得了加速效果,可以处理更广泛的计算类型,并且在处理大型矩阵时性能通常接近手工调优的矩阵乘法库的 15%。