Mar, 2024

促进葡萄牙语开放神经编码器生态系统与 Albertina PT * 系列的发展

TL;DR为了促进葡萄牙语的神经编码,本论文提出了一些基础的编码器模型,这些模型是为这种语言开发的大型语言模型稀缺的生态系统的扩展,而且都是免费开放的,可以用于任何目的,包括研究和商业用途。此外,我们还获得了对其生态系统有意义的进一步结果,即基于 SuperGLUE 基准的葡萄牙语新数据集,我们也进行了开放分发。