BriefGPT.xyz
大模型
Ask
alpha
关键词
inference speed up
搜索结果 - 1
SHARCS: 通过动态宽度子网络进行有效的 Transformer 路由
SHARCS 是一种自适应推理方法,通过考虑输入样本的难度,训练了一个路由器来将不同样本定向到具有不同宽度的子网络,实验证明,SHARCS 在准确性与 FLOPs 方面优于或补充了现有的逐样本自适应推理方法,能够泛化到不同的架构,甚至应用于
→
PDF
9 months ago
Prev
Next