May, 2024

一种新闻文章基于事件的嵌入式表示方法

TL;DR通过关注文章中提到的实体、主题及其与具体事件的历史联系,提出一种优化新闻嵌入生成的轻量级方法,包括事件、实体和主题的提取、时态分离 GloVe 模型的周期性时间嵌入生成以及使用 Smooth Inverse Frequency 和 Siamese 神经网络相结合生成新闻嵌入。我们的实验证明,该方法显著提高了所有任务和数据集上的 Precision-Recall AUC,相对于 SIF 方法和半监督方法,日常共享事件检测任务的平均 PR AUC 改进了 2.15% 和 2.57%,月度共享事件检测任务的 PR AUC 改进了 2.57% 和 2.43%。