BriefGPT.xyz
Ask
alpha
关键词
superglue benchmark
搜索结果 - 5
促进葡萄牙语开放神经编码器生态系统与 Albertina PT * 系列的发展
为了促进葡萄牙语的神经编码,本论文提出了一些基础的编码器模型,这些模型是为这种语言开发的大型语言模型稀缺的生态系统的扩展,而且都是免费开放的,可以用于任何目的,包括研究和商业用途。此外,我们还获得了对其生态系统有意义的进一步结果,即基于 S
→
PDF
4 months ago
ACL
中间层和标签真的必要吗?通用语言模型蒸馏方法
该研究提出了一种通用语言模型压缩方法(GLMD),该方法通过执行两个阶段的词汇预测压缩和词汇量压缩来消除模型之间的维度和结构约束,同时不需要标记数据集,并在 SuperGLUE 基准上超过最佳方法的平均得分 3%。
PDF
a year ago
ICLR
神经调控门控变压器
我们介绍了一种新颖的架构 —— 神经调制门控变压器 (NGT),通过乘性效应实现变压器中的神经调制。我们将其与基准进行比较,并证明其在 SuperGLUE 基准验证集中获得了最佳平均性能。
PDF
a year ago
斯洛文尼亚超级 GLUE 基准:翻译和评估
通过描述 Slovene combined machine-human translated SuperGLUE benchmark 的翻译过程中出现的问题,我们评估了单语、跨语言以及多语言等三种模式下的表现,并发现单语斯洛文尼亚语 Slo
→
PDF
2 years ago
GPT 也能理解
利用可训练的连续提示嵌入 (P-tuning) 方法,在自然语言理解 (NLU) 任务上,GPT 在不需要额外文本的情况下,能够比同等大小的 BERT 表现更好或者相当,并且在 LAMA 基准测试中恢复了 64%的世界知识,同时在监督学习中
→
PDF
3 years ago
Prev
Next