关键词mixed-precision architecture
搜索结果 - 2
- 内存模拟计算架构与张量处理单元的异构集成
提出了一种新颖的异构混合信号混合精度架构,将 IMAC 单元与边缘 TPU 集成以提高移动 CNN 性能,借助 TPUs 卷积层和 IMAC 电路密集层的优势,设计了一种统一的混合精度训练算法,模拟结果表明,TPU-IMAC 构型在各种 C - SAMP:自适应混合精度模型推理工具包
本文提出了一种自适应混合精度 (SAMP) 工具包来控制量化率,以平衡效率和性能,可以轻松量化模型进行推理。实验结果表明,SAMP 工具包的加速比优于 PyTorch 和 FasterTransformer,同时保证所需性能。此外,SAMP