- 从危险到可能性:探究人类(与人工智能)偏见如何影响在线论坛
社交媒体分析是通过复杂网络分析和自然语言处理的工具来分析社交互动、用户生成的内容和偏见的现象,主要围绕在线辩论、在线支持群体和人类与人工智能的互动展开讨论,同时强调社交媒体内部的双重困境与可能性,以及人机生成内容中隐藏的人类和非人类偏见。
- 基于卷积神经网络的微博情感分析:自然语言处理方法
本研究采用卷积神经网络(CNN)对来自微博的 119,988 篇原始推文进行情感分析,利用词嵌入进行特征提取,并在情感标签的基础上训练模型执行情感分类,实现了对积极、中立和消极情绪的平衡分类,展示了 CNN 在情感分析任务中的有效性。
- RoBERTweet:适用于罗马尼亚推文的 BERT 语言模型
本文介绍了 RoBERTweet,这是首个使用罗马尼亚推文进行训练的 Transformer 架构,研究结果表明在推特情感检测、性别歧视语言识别和命名实体识别三个自然语言处理任务中,RoBERTweet 模型优于之前的普通领域罗马尼亚语和多 - 探索社交媒体对 COVID-19 患者早期发现抑郁症的作用
通过社交媒体分析,该研究调查了 COVID-19 感染与抑郁症之间的关系,提出了一种考虑情绪特征、基于深度神经网络的早期预测模型,实验结果表明该模型能够有效检测抑郁症风险,可帮助公共卫生组织对高风险患者进行及时干预。
- PolyHope: 基于推特的两级希望言论检测
本文介绍了一个用于分类 Twitter 推文的希望言论数据集,并提供了基于不同学习方法的多项基准测试以进行评估和分析。研究中发现,使用严格的注释过程并提供详细的注释指南可以提高数据集的质量。同时,使用上下文嵌入模型进行希望言论检测有更高的性 - 立场检测与开放研究方向
本教程旨在介绍立场检测领域的最新研究进展,并为有兴趣的研究人员和实践者提供开放的研究方向。立场检测是一个新兴的研究课题,利用给定的内容确定对于特定目标或目标集的立场,在各个领域中有着重要的应用机会。本教程包含两个部分,其中第一部分概述了立场 - MM在低资源环境中分类 COVID-19 相关的尼泊尔推特
本研究基于 Nepali 语言使用自动化的社交媒体分析工具,将 COVID-19 相关的推文自动分类为八个主题,并使用网络平台呈现结果,该研究比较了 Nepali 的两个最新多语言语言模型(mBERT 和 MuRIL)的表现。结果表明,Mu - COLINGCommunityLM: 从语言模型中探究党派世界观
利用社区语言模型,研究政治言论语言化的分歧,通过观察群体在社交媒体中的表达,详细分析不同派别的观点,并且发现了相对于其他方法更高的对比度。
- SIGIRCAVES:一个用于促进 COVID 疫苗关注事项可解释分类和总结的数据集
该论文介绍了一个多标签分类数据集 CAVES,该数据集包含了约 10k 条关于 COVID-19 反疫苗推文,并提供了详细说明。该数据集也是一个提供标签说明的多标签分类数据集,以及提供了类别总结的推文。作者对该数据集进行了初步的实验,发现其 - 基于提示的人格和人际反应预测系统
利用预训练语言模型的提示学习方法,采用数据增强和模型组合,实现了计算机对主观性、情感和社交媒体分析领域的个性预测任务,同时提供了在线软件演示和代码的方便研究。
- 使用句法特征改进联合层 RNN 关键词提取
本研究旨在提高从印尼 Twitter 数据中提取关键词的精确度,使用句法特征等额外信息修改 JRNN 模型的输入层提取多个关键词序列,并使用数据增强方法增加训练示例。在实验证明该方法优于基线方法,精度和 F1 分别达到 0.9597 和 0 - COVID-19 社交媒体信息疫情
本研究通过分析 Twitter、Instagram、YouTube、Reddit、Gab 等社交媒体平台上信息扩散的情况,探讨了 COVID-19 话题的传播情况,并运用流行病学模型分析了每个社交媒体平台在信息传播方面的表现,发现每个平台都 - ICCVGeoStyle:发现时尚趋势与事件
本研究提供了一种自动化框架,分析大量的街头时尚图片,以发现和预测各种时尚属性的长期趋势和自动发现的风格,并确定影响人们穿着的时空本地化事件。相比之前的方法,我们的框架可以做出超过 20%的长期趋势预测,并发现了成百上千个影响全球时装的具有社 - 将社交媒体纳入泛欧洲洪灾预警系统:多语言方法
本文介绍了一个将社交媒体分析集成到欧洲洪水预警系统(EFAS)中的原型系统。该系统能够自动触发社交媒体数据的收集,并采用多语言方法通过语言不可知的单词嵌入和语言对齐的单词嵌入来找到与洪水相关的消息。同时,作者们还提出了一种选择相关和代表性消 - 社交媒体与选举操纵的风险与挑战分析:2018 年美国中期选举
本篇论文探讨了 2018 年美国中期选举的选民欺诈和压制问题,并通过分析社交媒体数据,找到了选举干扰的罕见迹象。研究发现,社交媒体数据的分析存在着诸多误差和局限性,因此必须谨慎对待这些数据。
- NIPS通过元属性预测任务解释推文表示中的句法和社交元素
本研究对推特文本表示方法的核心属性进行评估和分析,旨在打开社交媒体文章向量表示的黑匣子,以便更好地理解这些方法为文本编码的方式以及其表现的能力,以有助于社交媒体信息处理的应用。
- EMNLPTweeTime: 在 Twitter 中识别和标准化时间表达的最小监督方法
TweeTIME 是一种时间标记工具,用于在 Twitter 中识别和规范化时间表达式。它通过大量未标记数据的最小监督方法学习,并不需要手工规则或手工标注的训练语料库,其性能远优于广泛采用的最新系统,F1 得分为 0.68。