BriefGPT.xyz
Ask
alpha
关键词
fast feedforward
搜索结果 - 1
快速前馈网络
我们介绍了快速前馈(FFF)架构,它打破了层大小与推理成本之间的线性关系,通过引入对数时间的前馈网络的替代方案。我们展示了 FFF 在推理成本的指数分数上表现出与前馈网络相当的性能,与专家混合网络相比更快地提供性能,并且可以在 transf
→
PDF
10 months ago
Prev
Next