Jan, 2024

CFTM:连续时间分数主题模型

TL;DR本文介绍了连续时间分数主题模型(cFTM),这是一种新的动态主题建模方法,它利用分数布朗运动(fBm)有效地识别时间上的主题和词分布的正向或负向相关性,揭示出长期依赖或粗糙性。我们的理论分析证明了cFTM可以捕捉主题和词分布中的这种长期依赖或粗糙性,反映了fBm的主要特征。此外,我们证明了cFTM的参数估计过程与LDA(传统主题模型)的相当。为了验证cFTM的性能,我们使用经济新闻文章进行了实证研究。这些测试的结果支持该模型在跟踪主题的长期依赖或粗糙性方面的能力。