Mar, 2024
Juru:来自可靠来源的巴西合法大型语言模型
Juru: Legal Brazilian Large Language Model from Reputable Sources
Roseval Malaquias Junior, Ramon Pires, Roseli Romero, Rodrigo Nogueira
TL;DR通过领域专门化和高质量数据预训练,我们研究了大语言模型的高计算成本问题,发现领域专门化可以降低预训练数据量,但会牺牲同一语言中其他知识领域的性能。这一研究有助于证明预训练数据的选择可以提升大语言模型的性能,从而降低研究成本。