CFGPT:具有大型语言模型的中文金融助手
金融行业中,大型语言模型(LLMs)表现出了非凡的水平,在理解和生成类似人类的文本方面具有巨大的潜力,然而,现有的 LLMs 在金融领域中存在不足之处,这主要归因于一般文本数据和金融文本数据之间的差异。为了解决这个问题,我们引入了一种开源数据为中心的框架 —— 金融生成预训练 Transformer(FinGPT),通过自动收集和筛选来自互联网上的实时金融数据,为研究人员和从业人员提供了开放和透明的资源,以开发他们的 FinLLMs。此外,我们提出了一种简单而有效的策略,即使用市场的内在反馈进行 FinLLM 的精细调整,称为股票价格强化学习(RLSP)。最后,我们展示了几种 FinGPT 的应用,包括机器顾问,算法交易的情感分析以及低代码开发。FinGPT 旨在民主化金融领域的 LLMs,激发创新,并在开放金融领域中开启新的机会。
Jul, 2023
本文介绍了 BloombergGPT, 这是一个在大量金融数据上训练得到的具有 500 亿参数的语言模型。通过使用混合数据集进行训练,我们得到的模型不仅在金融任务上表现出色,还在普遍的 LLM 基准测试上得到了不错的表现,同时也解释了模型构建、训练过程和评估方法。
Mar, 2023
本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型(FinGPT),通过自动数据处理管道和低秩度量适应技术,为研究人员和从业者提供访问、透明的资源,并展示了机器人顾问、算法交易和低代码开发等潜在应用。
Jun, 2023
介绍了基于 T5 模型的新型 BBT-FinT5 中文金融预训练语言模型,同时构建了大规模金融语料库 BBT-FinCorpus 并提出了中文金融语言理解与生成评估基准 BBT-CFLEB 以促进金融领域自然语言处理研究。
Feb, 2023
通过引入 CT-LLM,这项研究介绍了一个 2B 规模的大型语言模型(LLM),以优先考虑中文语言的发展。这项研究挑战了在英文语料库上培训 LLMs 并将其适应其他语言的常规模式,为 LLM 培训方法学的拓宽开创了新的可能性。
Apr, 2024
通过 CFBenchmark 评估了大型语言模型在中文金融助手中的性能,发现现有模型在金融文本处理的基本任务中仍有显著改进空间。
Nov, 2023
近年来,对优质医疗服务的需求日益增长,凸显了医疗基础设施中的差异。随着大数据,特别是文本,成为医疗服务的基石,迫切需要专为医疗领域量身定制的有效自然语言处理(NLP)解决方案。我们提出了 ChiMed-GPT,这是一个专为中国医疗领域设计的新型基准大语言模型,其上下文长度扩展为 4,096 个标记,并经历了全面的预训练、有监督微调和强化学习高强度训练过程。在信息提取、问题回答和对话生成等真实世界任务中的评估结果表明,ChiMed-GPT 在医疗领域的性能优于一般领域的大语言模型。此外,通过要求 ChiMed-GPT 执行涉及对患者歧视的态度评定,我们分析了可能存在的偏见,以促进医疗领域大语言模型的负责任开发。代码和模型已经在此 URL 发布。
Nov, 2023
通过数据中心的方法,我们提出了一种能够更好地处理金融任务的金融 LLM(FLLM)模型,通过多任务提示优化来对数据进行预处理和预理解,并通过推断增强推理(AAR)自动生成训练数据,实验结果表明,我们的数据中心 FLLM 模型显著优于基于原始文本的金融 LLMs,在金融分析和解释任务上达到了最新水平,我们还开源了一个新的金融分析和解释基准,这种方法为解锁 LLMs 在复杂现实领域的潜力提供了希望。
Oct, 2023
基于大型语言模型,通过使用常见的金融公式生成金融问题回答数据,FinLLMs 方法提供一种解决数据资源有限和注释成本高昂问题的方法。实验结果表明,由 FinLLMs 生成的合成数据有效地提升了金融领域几个大规模数值推理模型的性能,超过了两个常用基准金融问题回答数据集。
Jan, 2024