优化的基于文本的时间序列指标
该研究旨在使用金融文本分析来估计多个资产之间的相关结构,并通过自然语言处理验证其对未来相关系数变化的预测准确性,结果表明该方法与传统的时间序列数据预测相比具有实用性。
May, 2024
通过整合文本线索与时间序列数据,本研究引入了一种新颖的文本引导时间序列预测(TGTSF)任务,并提出了一个稳健的基准模型 TGForecaster,它利用交叉注意机制融合文本线索和时间序列数据。通过四个精心策划的基准数据集对所提出的框架进行了综合评估,验证了 TGForecaster 在各类数据中始终保持领先的性能,凸显了将文本信息纳入时间序列预测的潜力。该研究不仅开创了一种新的预测任务,而且为未来的研究建立了一个新的基准,推动了多模态数据集成在时间序列模型中的发展。
May, 2024
本文提出一个动态和静态主题模型,能同时考虑时间上的主题演化和每个时间的主题层级结构,以此来分析结构化的时间序列文档。作者通过实验表明,该方法在科学论文集的主题提取方面优于传统模型,并展示了提取出的主题结构,以此来帮助对研究活动进行分析。
May, 2018
本文介绍了一种基于贝叶斯优化的文本输入表示方法的优化方法,用此方法可以使标准线性模型在各种话题分类和情感分析问题上与基于潜变量模型或神经网络的先进方法相竞争,这种方法是构建原始文本黑盒 NLP 系统的第一步.
Mar, 2015
通过使用 Google 开发的预训练模型 BERT 以及 LSTM,结合期权和市场隐含方法,构建了一个更通用和综合的金融情感分析框架,证明了在金融情感分析中应用 BERT 相较于现有模型的显著改进,并进一步提供了对个股收益率可预测性的令人信服的结果。
Jun, 2019
多元概率时间序列预测的新模型引入了 copula 理论,提出了基于 transformer 的简化目标函数 TACTiS,其分布参数数量与变量数量成线性关系。新目标函数引入了训练计划,并对原始架构进行必要的改变。结果表明,该模型在各种真实世界预测任务中具有显著改进的训练动力学,并实现了最先进的性能,同时保持了如处理不对齐和采样不均匀的时间序列等先前工作的灵活性。
Oct, 2023
该论文基于新型和经典数据集引入了一个无结构数据情况下的基准测试,评估了几种经典和神经基础模型,并发现基于静态领域词汇表示的轻量级词袋模型在多年的文本数据中获得了出人意料的良好结果。
Aug, 2022
本文研究运用情感分析和文本检索技术,分析股市公司年度披露的情感语言,来预测市场的波动性。同时结合市场数据,采用基于词嵌入的方法来有效地预测市场风险,结果表明词嵌入方法的预测表现优于其他方法,并且探讨了不同行业的公司报告特征。
Feb, 2017