Nov, 2023

DLAS:深度学习加速器方案的探索与评估

TL;DR深度神经网络的加速和优化在资源有限的设备上是具有挑战性的,这篇论文结合了机器学习和系统技术,在 Deep Learning Acceleration Stack (DLAS) 中演示了如何通过整合不同层面的改进技术来提高加速效果,并强调了由于参数调整引起的 DLAS 各层之间的相互影响。研究发现,模型大小、准确性和推理时间之间并没有必然的关联,压缩技术的加速效果也受具体硬件平台的影响,而编译器自动调优可能会改变最佳算法的选择,因此需要进行协同设计来进一步优化加速深度学习的解决方案。