BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-layer parameter sharing
搜索结果 - 1
MiniALBERT: 基于参数高效递归 Transformer 的模型蒸馏
本文介绍 MiniALBERT,一种将已有的完全参数化的语言模型转换为压缩递归模型的技术,探讨了论文中提出的模型蒸馏、跨层参数共享、瓶颈适配器等技术对压缩模型的 fine-tuning 效果以及在多种领域的实验结果。
PDF
2 years ago
Prev
Next