BriefGPT.xyz
Ask
alpha
关键词
kronecker decomposition
搜索结果 - 3
知识图谱嵌入的克罗内克分解
本文基于 Kronecker 分解技术提出了一种方法来减少知识图嵌入模型中的参数数量,拥有更好的参数效率、特征重用和对输入噪声的鲁棒性,在基准数据集上进行了一系列实验表明其有效性。
PDF
2 years ago
GPT 压缩的 Kronecker 分解
本研究使用 Kronecker 分解压缩 GPT-22 模型的线性映射,并使用该技术训练得到一种新型的神经语言模型 KnGPT2,该模型在经过有效预训练后,可在具有相同参数数量的情况下,优于现有的 DistilGPT2 模型,在语言建模和通
→
PDF
3 years ago
KroneckerBERT: 通过知识蒸馏学习预训练语言模型的 Kronecker 分解
本文利用 Kronecker 分解技术对预训练语言模型进行压缩,在保证模型高通用性的同时,将模型大小压缩至原大小的 5%,并在多个 NLP 基准测试上实现更好的性能和全新的 out-of-distribution 鲁棒性表现。
PDF
3 years ago
Prev
Next