Nov, 2023

构建领域特定的大型语言模型的高效连续预训练

TL;DR本研究探讨了持续预训练作为开发面向特定领域的大型语言模型的一种替代策略,引入了通过领域自适应持续预训练在金融领域上开发的 FinPythia-6.9B,FinPythia 通过金融任务中持续预训练实现了稳定的改进,并进一步探索了简单而有效的数据选择策略,相较于常规的持续预训练方法,我们的数据选择策略在使用仅 10% 的语料库大小和成本时表现更好,在开放领域的标准任务上没有任何退化。本研究提出了一种以成本效益的方式构建面向特定领域的大型语言模型的替代解决方案。