BriefGPT.xyz
Ask
alpha
关键词
hard-gate knowledge distillation
搜索结果 - 1
EMNLP
硬门知识蒸馏 —— 利用校准实现强韧可靠的语言模型
在知识蒸馏中,我们探索了一个很少被关注的问题:什么时候蒸馏知识?我们提出了模型校准的概念,将教师模型视为不仅提供知识的源头,而且作为检测学生模型失调的一个标尺。这种新颖的观点导致了一个硬门控知识蒸馏方案,可以在教师模型和训练数据之间进行学习
→
PDF
2 years ago
Prev
Next