BriefGPT.xyz
Ask
alpha
关键词
softmax implementation
搜索结果 - 1
针对量化 Transformer 的高能效注意力和 Softmax 加速器
该论文提出了 ITA,一种新颖的加速器架构,用于 Transformer 模型和相关模型的高效推理,通过利用 8 位量化和一种仅操作整数值的创新 softmax 实现,在嵌入式系统上实现了低功耗和高效能。ITA 在能效上与最先进的 Tran
→
PDF
a year ago
Prev
Next