NumLLM:针对中国金融领域的数值敏感大型语言模型
基于大型语言模型,通过使用常见的金融公式生成金融问题回答数据,FinLLMs 方法提供一种解决数据资源有限和注释成本高昂问题的方法。实验结果表明,由 FinLLMs 生成的合成数据有效地提升了金融领域几个大规模数值推理模型的性能,超过了两个常用基准金融问题回答数据集。
Jan, 2024
我们通过使用大型语言模型(LLMs)的指导调优,研究了用 XBRL 标签自动注释在财务文件中出现的相关数值(GAAP 指标)的问题,提出了一种参数高效的解决方案(FLAN-FinXC),并在两个最近发布的财务数字标签数据集上取得了最新的最佳表现。
May, 2024
通过数据中心的方法,我们提出了一种能够更好地处理金融任务的金融 LLM(FLLM)模型,通过多任务提示优化来对数据进行预处理和预理解,并通过推断增强推理(AAR)自动生成训练数据,实验结果表明,我们的数据中心 FLLM 模型显著优于基于原始文本的金融 LLMs,在金融分析和解释任务上达到了最新水平,我们还开源了一个新的金融分析和解释基准,这种方法为解锁 LLMs 在复杂现实领域的潜力提供了希望。
Oct, 2023
该研究针对金融领域进行了大规模语言模型(LLM)的适应性研究,并着重研究了金融情感分析,发现通过精细调整基础模型并结合金融文档和指令数据集,小型 LLM 在性能上与大型模型可媲美,而且在参数和数据方面更高效。此外,研究还展示了如何通过 LLM 生成人工指令以增加指令数据集的样本数量。
Jan, 2024
近期大规模语言模型 (LLM) 的发展在金融领域开创了人工智能应用的新可能性。本文提供了一份实用的调查报告,关注 LLM 在金融任务中的两个关键方面:现有解决方案和采用指南。首先,我们回顾了目前在金融领域中采用 LLM 的方法,包括通过零样本或少样本学习利用预训练模型,对领域特定数据进行微调,以及从头开始训练自定义 LLM。我们总结了关键模型并评估了它们在金融自然语言处理任务上的性能改进。其次,我们提出了一个决策框架,以帮助金融业专业人员根据数据、计算和性能需求选择合适的 LLM 解决方案。该框架提供了从轻量级实验到大规模投资自定义 LLM 的路径。最后,我们讨论了在金融应用中利用 LLM 所面临的限制和挑战。总的来说,该调查旨在综述最新技术并为负责任地应用 LLM 推动金融人工智能提供路线图。
Sep, 2023
金融情感分析是将金融文本内容分类为情感类别(如积极、消极和中性)。本文聚焦于金融新闻标题的分类,通过利用预训练的大型语言模型以及监督微调技术,实现在少量训练样本情况下显著超越之前最先进的算法。
Jan, 2024
该研究提供了一个严谨和全面的基准以及一个标准化的回测框架,以客观评估各种类型的 LLM 在从中国新闻文本数据中提取情感因子方面的有效性,从而支持大规模语言模型在量化交易策略中的应用。
Jun, 2023
在金融情感分析领域,传统的 NLP 模型受到参数大小和训练数据范围的限制,以及简洁的财经新闻文本缺乏上下文的问题,而无法很好地泛化和提高准确性。为了解决这些挑战,本研究引入了一种基于检索增强的大型语言模型(LLMs)框架,该框架包括一个指导调整的 LLMs 模块和一个从可靠外部来源检索附加上下文的模块。与传统模型和 ChatGPT、LLaMA 等 LLMs 相比,我们的方法在准确性和 F1 得分方面取得了 15%到 48%的性能提升。
Oct, 2023
我们提出了一种多专家微调框架来构建金融领域的大型语言模型(LLM),DISC-FinLLM。我们的方法通过赋予通用 LLMs 多轮问答能力、领域文本处理能力、数学计算技巧和检索增强生成能力来改进通用 LLMs。我们构建了一个金融指令微调数据集,名为 DISC-FIN-SFT,其中包括四个类别(咨询、自然语言处理任务、计算和检索增强生成)的指令样本。在多个基准测试中进行的评估表明,我们的模型在各种金融场景中比基准模型表现更好。更多资源可以在此 https 链接中找到。
Oct, 2023