BriefGPT.xyz
大模型
Ask
alpha
关键词
uncertainty-aware factor
搜索结果 - 1
Avatar 知识蒸馏:自我集成教师模式与不确定性
本文提出一种新的知识蒸馏方法 ——Avatar Knowledge Distillation (AKD),通过生成因扰动转化而得的不同推理集合模型(Avatars)来协助学生模型更有效的学习,同时提出了一种基于推理模型差异的不确定性感知因素
→
PDF
a year ago
Prev
Next