BriefGPT.xyz
大模型
Ask
alpha
关键词
ta-dfkd method
搜索结果 - 1
AAAI
宽容专家的教师:与教师无关的无数据知识蒸馏
无数据知识蒸馏方法 (TA-DFKD)通过为生成器分配宽松的专家角色,而非严格的监督者角色,以更健壮和稳定的性能,实现了在各种教师模型下的蒸馏,并超越了现有的无数据知识蒸馏方法。
PDF
5 months ago
Prev
Next