多策略文本处理在金融数据分析应用中的应用

Apr, 2022

多策略文本处理在金融数据分析应用中的应用

Financial data analysis application via multi-strategy text processing

Hongyin Zhu

TL;DR本文主要介绍了如何利用多种数据挖掘技术和深度学习应用于金融文本处理场景，并且展示了如何使用自然语言处理（NLP）和知识图谱（KG）技术来从异构数据中识别金融风险和机会。

Abstract

Maintaining financial system stability is critical to economic development, and early identification of risks and opportunities is essential. The financial industry contains a wide variety of data, such as financial statements, customer information, stock trading data, news, etc. Massi

financial system stability risk identification data mining natural language processing knowledge graph

发现论文，激发创造

运用 QNLP 进行金融情感分析

在金融领域，质量上的微小改进就可能带来巨大的价值。本研究通过使用 DisCoCat 和 QLSTM 这两种方法，对量子自然语言处理 (QNLP) 领域中的情感分析问题进行了探索，并使用一种新颖的 ChatGPT 数据生成方法进行了超过 1000 个实际句子的案例研究，发现 QLSTM 的训练速度比 DisCoCat 快得多，并且在其可用的软件实现上实现了接近经典结果的性能。

Jul, 2023

基于定量分析和定性数据的股市预测数据集

本研究将机器学习应用于金融领域，尤其是股票市场预测。研究通过合作数字股票数据和定性文本数据，提供了一个包含来自新闻档案、电视新闻字幕、广播节目文字转录、推特、日常金融报纸等的 140 多万条文本数据的数据集，该数据集可用于股票市场预测的全球研究中。

Nov, 2023

将文章分解为事实和观点，并检索实体进行问题导向的摘要生成

该研究利用自然语言处理技术预测股票价格波动，旨在早期发现能够捕捉市场机会的经济、政治、社会和技术变化。通过从新闻文章中识别重要事实和事件，并使用这些事实与实体形成元组，以获取特定实体的市场变化摘要，最后结合所有摘要形成整篇文章的最终摘要。使用大型语言模型 GPT 3.5 进行摘要提取，并分析维基百科数据和《经济学家》的文章以建立公司和实体之间的关系。该研究旨在开发一种全面的系统，通过提前发现市场趋势和事件，为金融分析师和投资者提供更加明智的决策工具。

Oct, 2023

基于分层金融数据的行业趋势分析 2.0

本文提出了一种利用股票市场数据进行产业趋势分析的方法，并从显式分析和隐式分析两个方面引入了产业趋势分析方法，即层次数据分析和基于 GPT-2 预训练模型的分析，最终取得了良好的产业趋势分析结果。

Mar, 2023

金融欺诈检测的文本数据挖掘：深度学习方法

使用深度学习的方法对金融欺诈文本进行自然语言处理的二元分类任务，并且通过不同种类的神经网络模型，包括多层感知机、RNN、LSTM 和 GRU 等，进行了准确性比较，为金融欺诈检测领域提供了有价值的见解。

Aug, 2023

信息提取：在发展中国家超本地金融数据领域的应用

本研究使用自然语言处理技术，旨在解决获取发展中国家公司财务数据的问题。通过构建专门针对发展中国家金融文本数据的数据集，我们采用基于 Transformer 的 T5 模型进行文本到文本的处理，同时进行命名实体识别和关系提取，达到 92.44% 的准确率、68.25% 的精确度和 54.20% 的召回率。同时，我们还使用 SpaCy 进行序列处理，包括预训练和微调模型的命名实体识别以及使用 SpaCy 的依赖解析器输出和一些启发式方法来确定实体关系，最终实现了 84.72% 的准确率、6.06% 的精确度和 5.57% 的召回率。

Mar, 2024

金融年报特征提取的多任务学习

通过使用多任务学习方法，结合不同任务上的信息，我们提出了多种金融文本分类方法，重点关注金融情绪、客观性、前瞻性句子预测和 ESG 内容检测。然后，我们使用这些分类器从 FTSE350 公司的年度报告中提取文本特征，并研究 ESG 定量分数与这些特征之间的关联。

Apr, 2024

基于注意力机制循环神经网络的金融新闻股票趋势预测

使用深度神经模型从新闻文本中提取语义特征，应用自注意机制分配注意力，并预测标准普尔 500 指数和个人公司股价的方向性变化，表明该技术与其他最先进的方法相当竞争，证明了最新的自然语言处理技术对计算金融业的有效性。

Nov, 2018

AlphaFin: 用检索增强的股票链框架进行金融分析基准测试

通过 AlphaFin 数据集和 Stock-Chain 方法，有效地解决了金融分析中的挑战，提供了可解释性的股票趋势预测和金融问答的综合框架。

Mar, 2024

自然语言处理与多模式股价预测

该研究利用股票百分比变化作为训练数据，采用人工智能技术（如长短期记忆网络、支持向量机和自然语言处理模型）分析公开发布的新闻文章，使用专门的 BERT 自然语言处理模型预测股票价格趋势，强调不同数据特征和行业特定数据的有效性。

Jan, 2024