BriefGPT.xyz
大模型
Ask
alpha
关键词
sample generation strategies
搜索结果 - 1
通过合成数据防止知识蒸馏中的灾难性遗忘和分布不匹配
本论文提出了一种基于知识蒸馏的数据无需模型压缩框架,通过维护一个动态的生成样本集合并添加实际数据分布的限制,解决了现有数据无需压缩方法中可能存在的灾难性遗忘问题和人工数据分布不匹配问题。在 SVHN、Fashion MNIST 和 CIFA
→
PDF
3 years ago
Prev
Next