优化的基于文本的时间序列指标

May, 2024

Optimal Text-Based Time-Series Indices

David Ardia, Keven Bluteau

TL;DR我们提出了一种构建基于文本的时间序列指标的优化方法，通过优化文本指标来跟踪 VIX 指数和通胀预期，我们的结果凸显了我们方法相较于现有指标的优越性能。

Abstract

We propose an approach to construct text-based time-series indices in an optimal way--typically, indices that maximize the contemporaneous relati

text-based time-series indices optimal contemporaneous relation predictive performance inflation

发现论文，激发创造

基于文本的多资产配置相关矩阵

该研究旨在使用金融文本分析来估计多个资产之间的相关结构，并通过自然语言处理验证其对未来相关系数变化的预测准确性，结果表明该方法与传统的时间序列数据预测相比具有实用性。

May, 2024

超越趋势与周期性：以文本线索为指导的时间序列预测

通过整合文本线索与时间序列数据，本研究引入了一种新颖的文本引导时间序列预测（TGTSF）任务，并提出了一个稳健的基准模型 TGForecaster，它利用交叉注意机制融合文本线索和时间序列数据。通过四个精心策划的基准数据集对所提出的框架进行了综合评估，验证了 TGForecaster 在各类数据中始终保持领先的性能，凸显了将文本信息纳入时间序列预测的潜力。该研究不仅开创了一种新的预测任务，而且为未来的研究建立了一个新的基准，推动了多模态数据集成在时间序列模型中的发展。

May, 2024

分析时间序列文档集的动态和静态主题模型

本文提出一个动态和静态主题模型，能同时考虑时间上的主题演化和每个时间的主题层级结构，以此来分析结构化的时间序列文档。作者通过实验表明，该方法在科学论文集的主题提取方面优于传统模型，并展示了提取出的主题结构，以此来帮助对研究活动进行分析。

May, 2018

文本表征的贝叶斯优化

本文介绍了一种基于贝叶斯优化的文本输入表示方法的优化方法，用此方法可以使标准线性模型在各种话题分类和情感分析问题上与基于潜变量模型或神经网络的先进方法相竞争，这种方法是构建原始文本黑盒 NLP 系统的第一步.

Mar, 2015

通过文本分析提升创业成功率

通过扩大和丰富数据源以及特征数量，利用机器学习模型对创业公司的公开数据进行预测，可较准确地预测公司是否能在未来一定时间内筹集到资金。

Dec, 2023

基于检索的时间序列预测

本文旨在探讨如何降低时间序列预测的不确定性，并介绍了一种基于相关时间序列引用的简单有效的两阶段方法 ReTime 用于空时序列和时间序列插值。

Sep, 2022

基于 BERT 的金融情感指数和基于 LSTM 的股票收益可预测性

通过使用 Google 开发的预训练模型 BERT 以及 LSTM，结合期权和市场隐含方法，构建了一个更通用和综合的金融情感分析框架，证明了在金融情感分析中应用 BERT 相较于现有模型的显著改进，并进一步提供了对个股收益率可预测性的令人信服的结果。

Jun, 2019

TACTiS-2: 用于多元时间序列的更好、更快、更简单的注意力联合分布

多元概率时间序列预测的新模型引入了 copula 理论，提出了基于 transformer 的简化目标函数 TACTiS，其分布参数数量与变量数量成线性关系。新目标函数引入了训练计划，并对原始架构进行必要的改变。结果表明，该模型在各种真实世界预测任务中具有显著改进的训练动力学，并实现了最先进的性能，同时保持了如处理不对齐和采样不均匀的时间序列等先前工作的灵活性。

Oct, 2023

基于文本数据的次年破产预测：基准和基线模型

该论文基于新型和经典数据集引入了一个无结构数据情况下的基准测试，评估了几种经典和神经基础模型，并发现基于静态领域词汇表示的轻量级词袋模型在多年的文本数据中获得了出人意料的良好结果。

Aug, 2022

基于词嵌入信息检索模型的财务披露情感预测

本文研究运用情感分析和文本检索技术，分析股市公司年度披露的情感语言，来预测市场的波动性。同时结合市场数据，采用基于词嵌入的方法来有效地预测市场风险，结果表明词嵌入方法的预测表现优于其他方法，并且探讨了不同行业的公司报告特征。

Feb, 2017