BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-stage balanced distillation
搜索结果 - 1
多阶段均衡蒸馏:解决序列级知识蒸馏中的长尾挑战
大语言模型(LLMs)在各种自然语言处理任务中有了显著的进展,但部署仍然需要大量的计算资源。我们介绍了一种名为 Multi-Stage Balanced Distillation(BalDistill)的框架,通过在固定的计算资源预算内动态
→
PDF
13 days ago
Prev
Next