BriefGPT.xyz
大模型
Ask
alpha
关键词
teacher networks
搜索结果 - 2
COLING
KNOT:使用最优输运进行知识蒸馏来解决自然语言处理任务
我们提出了一种新的方法,使用最优传输进行知识蒸馏 (KNOT),从多个教师网络中提取自然语言的语义知识传输到一个学生网络中。此方法通过学习最小化分配给标签的概率分布的最优传输成本到教师模型的概率加权和的学生模型(全局)来训练学生模型,新的语
→
PDF
3 years ago
AAAI
综合分类知识的融合
本研究提出了一种名为知识聚合的新型模型复用任务,旨在从多个训练好的教师网络中提取知识,学习一种能够处理综合分类的轻量级学生模型,取得了很好的结果。
PDF
6 years ago
Prev
Next