Mar, 2024

Sabiá-2: 葡萄牙大规模语言模型的新一代

TL;DRSabi'a-2 是一种基于葡萄牙语文本训练的大型语言模型,通过在各种考试中进行评估,包括巴西大学的入学考试、专业认证考试以及各种学科的研究生考试,发现 Sabi'a-2 Medium 在 64 场考试中有 23 场性能超过或与 GPT-4 相当,有 58 场性能超过 GPT-3.5,且专业化能显著提高模型的性能而无需增加大小,使 Sabi'a-2 Medium 的每个标记的价格比 GPT-4 便宜 10 倍,此外,我们发现数学和编码是需要改进的关键能力。