Mar, 2024

Juru:来自可靠来源的巴西合法大型语言模型

TL;DR通过领域专门化和高质量数据预训练,我们研究了大语言模型的高计算成本问题,发现领域专门化可以降低预训练数据量,但会牺牲同一语言中其他知识领域的性能。这一研究有助于证明预训练数据的选择可以提升大语言模型的性能,从而降低研究成本。