本文介绍了一种基于社交媒体的立场检测的方法,该方法使用了情感分析来帮助检测人们的立场,同时构建了一个用于训练和测试机器学习模型的数据集,并使用了远程监督技术和词嵌入来进一步提高立场检测的准确性。
May, 2016
本文研究了基于社交媒体文本的命名实体识别,旨在提高土耳其推特上的识别效果,通过放宽语言规则和扩展词汇资源,以及使用简单的标准化方案,得到了实验结果和讨论。
Oct, 2014
本研究旨在创建 Tweebank-NER,一个基于 Tweebank V2 的英文 NER 语料库,用 TB2 训练最先进的 Tweet NLP 模型,并发布名为 Twitter-Stanza 的 NLP 管道。
Jan, 2022
本文讨论了对于不规则、嘈杂、依赖上下文及动态性的推文(一种微博形式),运用自然语言处理技术进行挖掘和智能信息访问的挑战,重点关注了从推文中提取实体并进行实体消歧的任务,介绍了一个新的 Twitter 实体消歧数据集,并对多个最先进的 Named Entity Recognition & Disambiguation 模型进行了实证分析。
使用远程监督学习的 Word2Vec Skip-Gram 模型,以及递归神经网络,识别推文作者态度的高效系统。
Jun, 2016
本研究旨在探索利用预训练模型进行 Twitter 命名实体识别的问题,构建了一个包含七个实体类型的数据集 TweetNER7,并提供了一组语言模型基线。通过分析不同时期对语言模型性能的影响,尤其是短期降级、基于不同时间段进行语言模型微调的策略和自我标记作为最近标记数据的替代方案。
Oct, 2022
通过整合文本和图像的多模态信息,文章提出了一种简单而有效的 TMPT 框架,利用目标信息从文本和视觉模态学习多模态姿态特征,并在三个基准数据集上取得了最先进的多模态姿态检测性能。
Feb, 2024
本研究探讨了面向体育相关推特的立场检测问题,并使用基于 SVM 的分类器在不同的特征集上进行了评估,结果表明将基于 unigram、hashtags 和 named entities 的特征组合使用于 SVM 分类器中是该问题的一个可行方法。
Mar, 2018
该研究提出了一种利用社交信息生成关系嵌入的新方法,该方法可以应用于任何语言和目标,有助于在社交网络上进行立场检测。实验证明,将我们的关系嵌入与文本方法相结合可以显著提高性能。
通过对推特上有争议话题的帖子进行回复和引用回复的态度标注,创建了包含超过 5200 个态度标注的推特态度数据集,以提高谣言识别和用户间敌对关系判定的效果。同时,为了提高识别准确率,研究者还设计了引导标注数据选取的方法。研究表明,与单一信息源不同,收集回复和引述信息可以提高学习文本态度的准确性。
Jun, 2020