BriefGPT.xyz
Ask
alpha
关键词
efficient pruning
搜索结果 - 2
通过彩票票据假设和基于知识蒸馏的神经网络修剪增强推荐系统的可扩展性
该研究介绍了一种创新方法,旨在高效剪枝神经网络,特别关注其在边缘设备上的部署。通过将 “Lottery Ticket Hypothesis”(LTH)与 “Knowledge Distillation”(KD)框架相结合,我们提出了三个不同
→
PDF
6 months ago
结构化丢弃降低 Transformer 深度
本文介绍了一种新的结构化 dropout 形式 ——LayerDrop,该形式可在训练过程中实现正则化效果,在推理时允许有效的剪枝。作者通过实验证明了该方法对机器翻译、语言模型、文本摘要、问答和语言理解等基准测试的提升,并提出使用该方法可以
→
PDF
5 years ago
Prev
Next