NumLLM：针对中国金融领域的数值敏感大型语言模型

May, 2024

NumLLM：针对中国金融领域的数值敏感大型语言模型

NumLLM: Numeric-Sensitive Large Language Model for Chinese Finance

Huan-Yi Su, Ke Wu, Yu-Hao Huang, Wu-Jun Li

TL;DR我们提出了一种新颖的大型语言模型（NumLLM），用于改进金融领域的理解能力，该模型通过在构建的金融语料库上进行微调以适应数字变量，并在金融问答基准上取得了最佳性能表现。

Abstract

Recently, many works have proposed various financial large language models (FinLLMs) by pre-training from scratch or fine-tuning open-sourced LLMs on financial corpora. However, existing FinLLMs exhibit unsatisfactory performance in understanding financial text when →

financial large language models numeric-sensitive large language model lora modules financial question-answering benchmark numeric variables

发现论文，激发创造

FinLLMs：用大型语言模型生成金融推理数据集的框架

基于大型语言模型，通过使用常见的金融公式生成金融问题回答数据，FinLLMs 方法提供一种解决数据资源有限和注释成本高昂问题的方法。实验结果表明，由 FinLLMs 生成的合成数据有效地提升了金融领域几个大规模数值推理模型的性能，超过了两个常用基准金融问题回答数据集。

Jan, 2024

大型语言模型的参数高效调优：极端金融数字标注

我们通过使用大型语言模型（LLMs）的指导调优，研究了用 XBRL 标签自动注释在财务文件中出现的相关数值（GAAP 指标）的问题，提出了一种参数高效的解决方案（FLAN-FinXC），并在两个最近发布的财务数字标签数据集上取得了最新的最佳表现。

May, 2024

面向数据的金融大型语言模型

通过数据中心的方法，我们提出了一种能够更好地处理金融任务的金融 LLM（FLLM）模型，通过多任务提示优化来对数据进行预处理和预理解，并通过推断增强推理（AAR）自动生成训练数据，实验结果表明，我们的数据中心 FLLM 模型显著优于基于原始文本的金融 LLMs，在金融分析和解释任务上达到了最新水平，我们还开源了一个新的金融分析和解释基准，这种方法为解锁 LLMs 在复杂现实领域的潜力提供了希望。

Oct, 2023

金融情感分析的大规模语言模型适应

该研究针对金融领域进行了大规模语言模型（LLM）的适应性研究，并着重研究了金融情感分析，发现通过精细调整基础模型并结合金融文档和指令数据集，小型 LLM 在性能上与大型模型可媲美，而且在参数和数据方面更高效。此外，研究还展示了如何通过 LLM 生成人工指令以增加指令数据集的样本数量。

Jan, 2024

金融领域大型语言模型综述

金融领域的大型语言模型（LLMs）较少研究，本文综述了金融 LLMs 的历史、技术、性能、机遇和挑战，包括训练方法、训练数据和性能评估等关键点。

Feb, 2024

金融中的大型语言模型：综述

近期大规模语言模型 (LLM) 的发展在金融领域开创了人工智能应用的新可能性。本文提供了一份实用的调查报告，关注 LLM 在金融任务中的两个关键方面：现有解决方案和采用指南。首先，我们回顾了目前在金融领域中采用 LLM 的方法，包括通过零样本或少样本学习利用预训练模型，对领域特定数据进行微调，以及从头开始训练自定义 LLM。我们总结了关键模型并评估了它们在金融自然语言处理任务上的性能改进。其次，我们提出了一个决策框架，以帮助金融业专业人员根据数据、计算和性能需求选择合适的 LLM 解决方案。该框架提供了从轻量级实验到大规模投资自定义 LLM 的路径。最后，我们讨论了在金融应用中利用 LLM 所面临的限制和挑战。总的来说，该调查旨在综述最新技术并为负责任地应用 LLM 推动金融人工智能提供路线图。

Sep, 2023

金融情绪分析的预训练大型语言模型

金融情感分析是将金融文本内容分类为情感类别（如积极、消极和中性）。本文聚焦于金融新闻标题的分类，通过利用预训练的大型语言模型以及监督微调技术，实现在少量训练样本情况下显著超越之前最先进的算法。

Jan, 2024

揭示情感的潜力：大型语言模型是否能够预测中国股市价格趋势？

该研究提供了一个严谨和全面的基准以及一个标准化的回测框架，以客观评估各种类型的 LLM 在从中国新闻文本数据中提取情感因子方面的有效性，从而支持大规模语言模型在量化交易策略中的应用。

Jun, 2023

通过检索增强的大型语言模型增强金融情感分析

在金融情感分析领域，传统的 NLP 模型受到参数大小和训练数据范围的限制，以及简洁的财经新闻文本缺乏上下文的问题，而无法很好地泛化和提高准确性。为了解决这些挑战，本研究引入了一种基于检索增强的大型语言模型（LLMs）框架，该框架包括一个指导调整的 LLMs 模块和一个从可靠外部来源检索附加上下文的模块。与传统模型和 ChatGPT、LLaMA 等 LLMs 相比，我们的方法在准确性和 F1 得分方面取得了 15％到 48％的性能提升。

Oct, 2023

DISC-FinLLM：基于多专家微调的中文金融大型语言模型

我们提出了一种多专家微调框架来构建金融领域的大型语言模型（LLM），DISC-FinLLM。我们的方法通过赋予通用 LLMs 多轮问答能力、领域文本处理能力、数学计算技巧和检索增强生成能力来改进通用 LLMs。我们构建了一个金融指令微调数据集，名为 DISC-FIN-SFT，其中包括四个类别（咨询、自然语言处理任务、计算和检索增强生成）的指令样本。在多个基准测试中进行的评估表明，我们的模型在各种金融场景中比基准模型表现更好。更多资源可以在此 https 链接中找到。

Oct, 2023