BriefGPT.xyz
大模型
Ask
alpha
关键词
switch transformer
搜索结果 - 2
临床叙述分类的小型开关变压器和基于 NLP 的模型
本研究提出了一种简化的 Switch Transformer 架构,针对小型法国临床文本分类数据集进行 scratch 训练。结果表明,简化的小型 Transformer 模型的性能优于包括 DistillBERT、CamemBERT、Fl
→
PDF
a year ago
Switch Transformers: 使用简单高效的稀疏性扩展至万亿级参数模型
通过 Switch Transformer 和降低精度格式,本文展示了如何简化 MoE 路由算法,降低信息交流和计算成本,以及解决训练不稳定问题,并在多语言领域提高了预训练速度并推动了现有语言模型的规模扩大,以 trillion 参数为例,
→
PDF
3 years ago
Prev
Next