Oct, 2023

FinGPT:金融数据集中开源大型语言模型的指令调整基准

TL;DR在自然语言处理(NLP)领域中,基于GPT模型在金融领域的潜力日益显现。然而,将这些模型与金融数据集结合存在一些挑战,特别是在确定它们的熟练程度和相关性方面。本文介绍了一种独特的方法,该方法以指令调整范式为基础,专门适用于金融环境中的开源大型语言模型。通过这种方法,我们充分利用开源模型的互操作性,确保了无缝透明的集成。我们首先解释了指令调整范式,强调其对即时集成的有效性。本文提出了一个基准测试方案,用于端到端的训练和测试,采用一种经济有效的进展方式。首先,我们评估了基本能力和基本任务,例如命名实体识别(NER)和情感分析,以增强特性。接下来,我们深入研究了一个全面的模型,通过汇集所有指令调整来执行多任务操作,以检验其多样性。最后,我们通过标记未见任务并结合新颖的数据集探索了零样本能力,以了解在未知领域的适应性。这样的范式巩固了开放性和可重现性的原则,为未来在开源金融大型语言模型(FinLLMs)中的研究奠定了坚实的基础。