FinGPT: 开源金融领域大型语言模型

Jun, 2023

FinGPT: 开源金融领域大型语言模型

FinGPT: Open-Source Financial Large Language Models

Hongyang Yang, Xiao-Yang Liu, Christina Dan Wang

TL;DR本文介绍了一种基于数据驱动和透明资源的开源金融领域大型语言模型（FinGPT），通过自动数据处理管道和低秩度量适应技术，为研究人员和从业者提供访问、透明的资源，并展示了机器人顾问、算法交易和低代码开发等潜在应用。

Abstract

large language models (LLMs) have shown the potential of revolutionizing natural language processing tasks in diverse domains, sparking great interest in finance. Accessing high-quality financial data is the firs

large language models finance fingpt data curation pipeline open-source

发现论文，激发创造

FinGPT: 金融大型语言模型的互联网规模数据民主化

金融行业中，大型语言模型（LLMs）表现出了非凡的水平，在理解和生成类似人类的文本方面具有巨大的潜力，然而，现有的 LLMs 在金融领域中存在不足之处，这主要归因于一般文本数据和金融文本数据之间的差异。为了解决这个问题，我们引入了一种开源数据为中心的框架 —— 金融生成预训练 Transformer（FinGPT），通过自动收集和筛选来自互联网上的实时金融数据，为研究人员和从业人员提供了开放和透明的资源，以开发他们的 FinLLMs。此外，我们提出了一种简单而有效的策略，即使用市场的内在反馈进行 FinLLM 的精细调整，称为股票价格强化学习（RLSP）。最后，我们展示了几种 FinGPT 的应用，包括机器顾问，算法交易的情感分析以及低代码开发。FinGPT 旨在民主化金融领域的 LLMs，激发创新，并在开放金融领域中开启新的机会。

Jul, 2023

BloombergGPT: 金融领域的大型语言模型

本文介绍了 BloombergGPT，这是一个在大量金融数据上训练得到的具有 500 亿参数的语言模型。通过使用混合数据集进行训练，我们得到的模型不仅在金融任务上表现出色，还在普遍的 LLM 基准测试上得到了不错的表现，同时也解释了模型构建、训练过程和评估方法。

Mar, 2023

h2oGPT：大规模语言模型的民主化

介绍了一种基于 h2oGPT 平台的开源语言模型，旨在创建开源的比闭源 GPT 更好的大型语言模型，这将促进 AI 的发展并使其更加可靠和透明。

Jun, 2023

FinGPT: 金融数据集中开源大型语言模型的指令调整基准

在自然语言处理（NLP）领域中，基于 GPT 模型在金融领域的潜力日益显现。然而，将这些模型与金融数据集结合存在一些挑战，特别是在确定它们的熟练程度和相关性方面。本文介绍了一种独特的方法，该方法以指令调整范式为基础，专门适用于金融环境中的开源大型语言模型。通过这种方法，我们充分利用开源模型的互操作性，确保了无缝透明的集成。我们首先解释了指令调整范式，强调其对即时集成的有效性。本文提出了一个基准测试方案，用于端到端的训练和测试，采用一种经济有效的进展方式。首先，我们评估了基本能力和基本任务，例如命名实体识别（NER）和情感分析，以增强特性。接下来，我们深入研究了一个全面的模型，通过汇集所有指令调整来执行多任务操作，以检验其多样性。最后，我们通过标记未见任务并结合新颖的数据集探索了零样本能力，以了解在未知领域的适应性。这样的范式巩固了开放性和可重现性的原则，为未来在开源金融大型语言模型（FinLLMs）中的研究奠定了坚实的基础。

Oct, 2023

FinGPT：小语种的大型生成模型

该研究聚焦于用于芬兰语的大型语言模型（LLMs）的创建和评估，通过从各种来源收集数据并进行预训练，综合其他语言模型的方法，在芬兰语领域取得了显著进展，并对模型的质量进行了评估，包括毒性和偏见。

Nov, 2023

FinVis-GPT：一个用于金融图表分析的多模态大型语言模型

本文提出了一种新颖的多模式大型语言模型 FinVis-GPT，专为金融图表分析而设计。通过利用 LLM 的强大能力以及整合指令调整和多模式功能，FinVis-GPT 能够解释金融图表并提供有价值的分析。通过进行几个案例研究，我们评估了模型的性能，结果表明 FinVis-GPT 在包括生成描述、回答问题和预测未来市场趋势等各种金融图表相关任务中优于现有的最先进多模式 LLMs。所提出的 FinVis-GPT 在金融领域中利用多模式 LLMs 的尝试是开创性的，我们生成的数据集将在不久的将来发布以加速相关研究。

Jul, 2023

ChatGPT 的一周年：开源大规模语言模型是否在迎头赶上？

2022 年底，ChatGPT 的发布在 AI 的研究和商业领域引发了巨大的风潮，通过使用监督微调和强化学习来对大型语言模型进行指令调优，它展示了模型能够回答人类提出的问题并按照广泛的任务进行指令遵循，使得大型语言模型的研究兴趣得到了极大的加强，各种新的大型语言模型层出不穷，包括很多专注于大型语言模型的初创公司。然而，尽管封闭源的大型语言模型（如 OpenAI 的 GPT 和 Anthropic 的 Claude）通常表现出色，但开源大型语言模型的进展也非常迅速，并声称在某些任务上实现了与 ChatGPT 持平甚至更好的结果，这对于研究和商业都具有重要的意义。在本研究中，我们在 ChatGPT 发布一周年之际，全面概述了这一成就，并调查了所有开源大型语言模型声称在各项任务中达到与 ChatGPT 持平或更好的情况。

Nov, 2023

CFGPT：具有大型语言模型的中文金融助手

本文介绍了一种名为 CFGPT 的中文金融预训练变换器框架，包括一个用于预训练和监督微调的数据集（CFData），一个用于管理金融文本的金融 LLM（CFLLM）和一个用于导航实际金融应用的部署框架（CFAPP）。

Sep, 2023

FinTral: GPT-4 级金融大语言模型家族

介绍了一种名为 FinTral 的多模态大型语言模型套件，通过使用领域特定的预训练、指导微调和 RLAIF 训练等方法，结合文本、数值、表格和图像数据进行金融分析，并演示了其在金融技术中能够在实时分析和决策方面取得显著进展。

Feb, 2024

用 LLM 彻底改革金融：应用和洞见概述

最近几年，大型语言模型（LLMs）如 ChatGPT 取得了显著的进展，并在各个领域得到了应用。这些模型建立在 Transformer 架构基础上，通过广泛的数据集训练，能够有效地理解和生成人类语言。在金融领域，LLMs 的部署正在迅速发展。它们被用于自动化财务报告生成、预测市场趋势、分析投资者情绪和提供个性化的财务建议。利用其自然语言处理能力，LLMs 可以从海量金融数据中提取关键见解，帮助机构做出明智的投资决策，提高运营效率和客户满意度。本研究全面介绍了 LLMs 在各种金融任务中的应用。此外，我们通过自然语言指令对多个金融任务进行了全面测试。我们的研究结果表明，GPT-4 在各种金融任务中能够有效地遵循指令。这项对 LLMs 在金融领域的调查和评估旨在加深金融从业者和 LLM 研究人员对 LLMs 在金融中的作用的理解，发现新的研究和应用前景，并强调如何利用这些技术来解决金融行业的实际挑战。

Jan, 2024