Dec, 2023

GeoGalactica:地质科学领域的科学大型语言模型

TL;DR通过使用大型语言模型 (LLMs) 进行地球科学的进一步预训练和监督微调,我们得到了一个包含 300 亿参数的地球科学领域最大的语言模型 GeoGalactica,并且在技术报告中详细介绍了它的各个方面,包括数据收集、数据清洗、基础模型选择、预训练、微调和评估。