用于危机响应的深度学习和词嵌入的推文分类
本论文旨在介绍基于神经网络的分类方法,该方法针对社交媒体上的危机信息进行二元和多元分类。本方法无需进行特征工程,相比现有的最先进的分类方法,其性能更佳,并可在缺乏标记数据的情况下取得良好的分类效果。
Aug, 2016
采用 BERT 嵌入并进行微调可以适应新危机,发现新主题,并从受监督训练中保留相关类别,利用双向自注意力提取主题关键词。其在人工和自动评估中胜过传统主题模型。
Mar, 2021
本文提出了基于 Transformer 的 CrisisBERT 模型和基于 Attention 的 Crisis2Vec 架构,分别用于危机检测、危机识别和危机嵌入,相较于传统方法,该架构表现出更好的性能和稳健性,在危机事件领域中,具有更好的应用前景。
May, 2020
本文介绍了一种新颖的深度学习框架,包括基于词汇表的方法用于句子级别情感标签预测。我们首先应用语义规则,然后使用深度卷积神经网络(DeepCNN)进行字符级嵌入,以增加词级嵌入的信息。然后,双向长短期记忆网络(Bi-LSTM)从词级嵌入中产生句子级特征表示。我们在三个 Twitter 情感分类数据集上评估了我们的方法。实验结果表明,我们的模型可以提高 Twitter 社交网络中句子级情感分析的分类准确性。
Jun, 2017
该研究提出了一种基于实体屏蔽语言建模和层次化多标签分类的多任务学习方法,以解决社交媒体危机管理中的事件相关偏差和高度不均衡标签分布问题,并在 TREC-IS 数据集上表现出高达 10% 的 F1 得分绝对性能提升。同时,实体屏蔽可以减少过度拟合和提高跨事件泛化能力。
Nov, 2022
Tweet2Vec 是一种新方法,用于通过字符级别的 CNN-LSTM 编码器 - 解码器生成推文的通用向量表示形式,可应用于推文的各种分类任务,并且该方法也适用于其他语言。
Jul, 2016
本文通过分别使用推特数据、通用数据和两种数据的结合,提出了十种单词嵌入数据集,并且演示了如何将这些数据集应用于推特情感分析和推特主题分类等 NLP 任务。
Aug, 2017
本文提出使用集成半监督学习方法来利用非标记数据,以更加快速和准确地对自然灾害等关键情况下所发布的社交媒体数据进行分类,从而更有效地提高救援响应效率。
May, 2018
研究实时分析信息以快速危机响应,并利用过去灾害的已标记数据进行跨语言域适应,以训练分类器。在同一类型和相似语言的事件中,过去的标记对分类器训练有用,并且穿越语言域适应有助于不同语言(如意大利语和西班牙语),而对于不同语言(如意大利语和英语),性能会降低。
Feb, 2016