关键词glue benchmark
搜索结果 - 68
- 参数高效微调的结构化无限秩矩阵PDF9 days ago
- SPAFIT: 分层渐进调适微调预训练大型语言模型PDF2 months ago
- AFLoRA:大型模型参数高效微调中自适应冻结低秩适应PDF3 months ago
- 基于 ReRAM 的 Transformer 语言模型的零空间成本容错技术PDF5 months ago
- 大型预训练语言模型的高效微调方法的实证分析PDF6 months ago
- 持续同调是否能净化基于 Transformer 的黑盒模型?BERT 压缩的案例研究PDF7 months ago
- EMNLP如何确定最强大的预训练语言模型而无需暴力微调?实证调查PDF7 months ago
- 语言模型的质量改进和压缩的共训练与共蒸馏PDF8 months ago
- EMNLPtorchdistill 与 Hugging Face 库的结合:基于 NLP 的可复现、无需编码的深度学习研究案例研究PDF8 months ago
- BERT 模型的知识蒸馏改进:损失函数、映射方法和权重调整PDF10 months ago
- 使您的预训练模型可逆:从参数到内存高效微调PDFa year ago
- ACLPreQuant: 面向预训练语言模型的任务无关量化方法PDFa year ago
- 语言缩水了:缩减规模后的语言模型行为PDFa year ago
- ACLTADA: 英语任务不可知的方言适配器PDFa year ago
- 大型 Transformer 的循环适应PDFa year ago
- 民主化扩散语言模型PDFa year ago
- ChatGPT 和 Fine-tuned BERT 的比较研究PDFa year ago
- AAAISKDBERT: 基于随机知识蒸馏的 BERT 压缩PDF2 years ago
- 面具更多,面具更晚:通过分解 [MASK] 令牌实现有效的遮蔽语言模型预训练PDF2 years ago
- 调整语言模型作为训练数据生成器,用于增强少样本学习PDF2 years ago
Prev