利用多模深度学习检测社交媒体上的医疗虚假信息
本研究提出了两种新方法:对比学习和掩码语言建模,以检测短视频社交媒体帖子中的语义不一致性,证明这些方法优于当前的最先进方法,可用于检测社交媒体帖子中的错误信息。
Feb, 2022
应对疫苗相关的多样化担忧,本文通过多种先进的自然语言处理技术和机器学习算法,包括 BERT、GPT 3.5、分类器链和传统方法如 SVM、随机森林、朴素贝叶斯,开发了一种强大的多标签分类器,能够根据与疫苗相关的担忧指定特定的关注标签。研究发现,尖端的大型语言模型在这个领域的表现超越其他方法。
Dec, 2023
使用半监督学习框架来解决极度类别不平衡的问题,并使用实际数据扩充少数类别,该方法在处理社交媒体中极不平衡的发布单元时比 SMOTE、ADASYN、GAN 等其他方法效果显著提高,尤其在相关的 Covid 数据上初步测试表明有效性。
Apr, 2023
本研究介绍了一种基于 BERT 的命名实体识别(NER)模型,一个深度学习规范化模块以及一个半监督聚类模块构建的框架,用于从社交媒体中提取与 COVID-19 相关的症状词典,并对其进行标准化,以减少在基于社交媒体的公共卫生研究中的关键词匹配信息检索约束。
Jun, 2023
通过使用深度学习的自然语言处理模型 BERT,该研究针对社交媒体上抗疫苗言论的高峰期间,对 1506 条推文进行了分类,并可视化了其随时间变化的趋势,从而为机构制定反击抗疫苗言论的策略提供了数据支持。
Jan, 2022
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本研究提出了一种用于识别社交媒体新闻帖子中视频外观和文本标题之间语义不一致的分类架构,通过使用基于文本分析、自动音频转录、语义视频分析、对象检测、命名实体一致性和面部验证的多模态融合框架来发现社交媒体帖子中的视频和标题之间的不匹配。通过训练和测试基于 4,000 个 Facebook 新闻帖子的新视频数据集,我们的多模态方法在随机标题和外观不匹配的情况下实现了 60.5%的分类准确性,而单模分别准确率不到 50%。进一步的消融研究证实了跨模态融合对于正确识别语义不一致性的必要性。
May, 2021
该研究提出了首个基于多模态检测在线反犹内容的自动化方法,致力于解决在线社交媒体不断泛滥的反犹行为。该方法包括从帖子中提取图像和文本信息,识别反犹言论的类别,以及评估系统的有效性和鲁棒性等方面。
Apr, 2021
本文提出了一种新的半监督方法 VADet 用于检测疫苗态度,该方法通过主题建模学习无标记数据的主题信息,再用少量手动注释的样本进行微调。实验结果表明,该方法能够学习到立场和方面主题,且在立场检测和推文聚类方面优于现有的基于方面的情感分析模型。
May, 2022