BriefGPT.xyz
大模型
Ask
alpha
关键词
student networks
搜索结果 - 2
不同领域之间的直接蒸馏
基于知识蒸馏,提出了一种新的单阶段方法 “不同领域之间的直接蒸馏”(4Ds),通过可学习的适配器和融合 - 激活机制,实现了从教师网络到学生网络的跨领域知识转移,取得了可靠的学生网络性能并超过了现有方法。
PDF
6 months ago
AAAI
软目标定向传输集成的无数据知识蒸馏
本研究提出了一个基于多元正态分布的数据自由知识蒸馏方法,该方法从过度参数化神经网络中模拟中间特征空间并利用软目标标签生成伪样本以作为转换集。使用这些合成的转移集训练多个学生网络,表现出与使用原始训练集和其他无数据知识蒸馏方法训练的网络相当的
→
PDF
3 years ago
Prev
Next