Feb, 2024

Pruner: 高效的跨平台张量编译器

TL;DR基于硬件和软件的深度学习加速器张量程序优化方法 Pruner,通过参数化静态分析器(PSA)和模式感知成本模型(PaCM)实现硬件感知性能分析和关键数据流模式的预测,再结合 Siamese 网络的动量迁移学习(MTL)策略以提高预训练成本模型的鲁棒性。丰富的实验结果表明,Pruner 在在线和离线场景的各种张量程序调整任务中具有高效性、先进性和低资源开销。