Nov, 2024

基于FPGA的运行时自适应变压器神经网络加速器

TL;DR该研究解决了变压器神经网络在资源受限设备上的高计算和内存需求问题。提出的ADAPTOR加速器通过运行时自适应机制和高效矩阵分块技术,提高了处理元件和片上内存的利用率,显著减少了延迟。评估结果显示,该设计在功耗效率方面优于现有的GPU和CPU,且在处理速度上也有显著提升。