BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-teacher learning
搜索结果 - 1
自适应多教师多层级知识蒸馏
我们提出了基于多教师多层知识蒸馏学习框架的自适应学习方法,该方法通过将每个教师与潜在表示相关联,自适应地学习实例级教师重要性权重,从而获取集成的高级知识,并通过多组提示策略从多个教师处汇集中间级知识。实验表明,该方法确保学生比强竞争者取得了
→
PDF
3 years ago
Prev
Next