Aug, 2023

Cabrita:弥合外语鸿沟

TL;DR通过使用 Portuguese 文本对 3-billion-parameter 模型进行连续预训练,本研究提出了一种名为 Cabrita 的方法,成功解决了性能和高效标记化问题,并以可负担得起的成本实现。