UTCNN:社交媒体立场分类的深度学习模型
社交媒体平台的兴起导致了在线讨论的极化增加,特别是在选举和气候变化等政治和社会文化议题上。我们提出了一种简单而新颖的无监督方法,利用用户在帖子中关于命名实体的观点,预测两个帖子的作者是否持相同立场。我们提出了 STEntConv,这是一种构建用户和命名实体之间带权重的图,并训练带符号图卷积网络(SGCN)来检测评论和回复帖子之间的分歧的模型。我们进行了实验和消融研究,并展示了在 Reddit 帖子数据集上,包含这些信息可以提高针对一系列有争议的子论坛主题的分歧检测性能,而无需特定平台特征或用户历史记录。
Mar, 2024
本文介绍了一种高度有效的非监督式框架,用于检测 prolific Twitter 用户对有争议话题的立场。该框架利用降维和聚类来找到不同立场的代表性核心用户,无需标记用户,可以在几秒钟或几分钟内进行手动标记,并且对于数据偏度具有鲁棒性。
Apr, 2019
该研究提出了一种利用 Twitter 时间轴内容分析的非监督态度检测框架 (Tweets2Stance) 来预测社交媒体用户态度的方法,并通过对六个政党在 20 个不同议题上的一致性进行分析,依据党派帐号的言论预测政治主张。结果表明,T2S 能以最小 MAE 为 1.13 的准确度成功检测用户的态度。
Apr, 2022
本文提出一种新的目标特定立场检测任务 —— 会话立场检测,旨在推断给定数据实例及其相应的会话主题的立场。为此,通过六个主要的香港社交媒体平台,使用注释技术构建基准会话立场检测(CSD)数据集,提出一种模型 Branch-BERT,将上下文信息融入到会话线程中以预测要检测的立场,实验证明该模型相较于其他基线模型能够取得更好的结果表现。
Nov, 2022
本文通过利用深度学习中的短文本分类方法来检测推特立场,并采用数据增强技术扩展和多样化训练数据集,结合词级和字符级模型构建分类器最终实现了精度、召回率和 F1 值均在 0.6 以上的结果。
Jun, 2016
本研究介绍了一种新的基于半监督学习的立场检测方法 SANDS,通过构建深度特征视图和利用社交网络提供的远程监督信号,SANDS 在美国和印度两个不同政治派别下的推文数据上获得了较高的 F1 得分 0.55 和 0.49。
Jan, 2022
本文旨在研究大型语言模型在对于语言数据集难以获得的语言,如形态复杂、资源较少的语言中进行自动立场检测的适用性,同时探索了 ChatGPT 作为一种全零样本分类器的可行性,结果表明 ChatGPT 的性能可与有监督学习相当。最佳模型的应用还可用于研究爱沙尼亚主流新闻来源和右翼民粹主义新闻来源在七年间的历时趋势,并探讨立场变更与现实事件的对应关系,这为新闻分析和媒体监测提供了一个更为简单和省钱的文本分类任务的替代方案。
May, 2023
研究论述了针对社交媒体中的谣言态度进行分类的方法,通过使用时序分类器,利用社交媒体交互或对话线程中固有的话语特征来评估其表现,结果显示出这种分类器对于特定的观点判断要比非时序分类器更为准确,LSTM 分类器的性能最佳,数据集和观点类型均表现出较高的准确性;此外,该研究分析了所研究的不同特征,并鉴别出在区分观点方面最有帮助的特征。
Dec, 2017