Oct, 2022

MiniALBERT: 基于参数高效递归 Transformer 的模型蒸馏

TL;DR本文介绍 MiniALBERT,一种将已有的完全参数化的语言模型转换为压缩递归模型的技术,探讨了论文中提出的模型蒸馏、跨层参数共享、瓶颈适配器等技术对压缩模型的 fine-tuning 效果以及在多种领域的实验结果。