BriefGPT.xyz
大模型
Ask
alpha
关键词
teacher-student optimization
搜索结果 - 3
CVPR
从无到有:用无监督知识蒸馏实现跨模态哈希
本文提出了一种新的方法,通过使用无监督方法产生的输出来指导监督方法,具体来说,使用师生优化来传播知识,在两个流行的 CMH 基准数据集 MIRFlickr 和 NUS-WIDE 上进行了实验,结果表明我们的方法大大优于所有现有的无监督方法。
PDF
4 years ago
快照蒸馏:一代中的教师 - 学生优化
本研究提出了快照蒸馏 (SD) 框架,它将深度神经网络的教师 - 学生优化方法应用于一个生成周期内,通过循环学习率策略以及利用同一周期内早期时期的信息提取,避免了时间复杂度的增大,同时在 CIFAR100 和 ILSVRC2012 等基准测
→
PDF
6 years ago
代际知识蒸馏:更具宽容性的教师教育更好的学生
本文从严格性控制角度研究了深度神经网络的教师网络和学生网络的优化问题。通过针对教师网络训练中的宽松性进行优化,使得学生网络在学习过程中更容易获得跨类别相似性信息,从而在 CIFAR100 和 ILSVRC2012 等数据集的图像分类任务中取
→
PDF
6 years ago
Prev
Next