BriefGPT.xyz
Ask
alpha
关键词
fpga-based acceleration
搜索结果 - 1
理解基于 FPGA 的空间加速对大型语言模型推理的潜力
通过对大型语言模型的空间加速进行研究,本文介绍了针对特定运算符或层的硬件单元专门化的方法,并通过数据流架构实现它们之间的直接通信,从而最小化片外内存访问延迟。研究通过在 AMD Alveo U280 FPGA 设备上实现 BERT 和 GP
→
PDF
6 months ago
Prev
Next