利用大型语言模型进行 COVID-Tweets 的多标签分类
应对疫苗相关的多样化担忧,本文通过多种先进的自然语言处理技术和机器学习算法,包括 BERT、GPT 3.5、分类器链和传统方法如 SVM、随机森林、朴素贝叶斯,开发了一种强大的多标签分类器,能够根据与疫苗相关的担忧指定特定的关注标签。研究发现,尖端的大型语言模型在这个领域的表现超越其他方法。
Dec, 2023
本研究评估了使用大型语言模型(例如 GPT-4)和弱监督来识别 COVID-19 疫苗相关的推文,以与人工注释者的性能进行比较。通过手动筛选的黄金标准数据集,利用 GPT-4 在无须额外微调或指示的情况下提供标签,在单次模式下进行分析。
Sep, 2023
使用大型语言模型(LLMs)在无需昂贵的训练数据集的零射击设置中检测在线话语中的疫苗关注点,分析了不同提示策略的成本和准确性权衡,结果显示 GPT-4 可以在 VaxConcerns 数据集上显著优于众包工作者准确率,获得 78.7% 的整体 F1 分数。
Feb, 2024
通过使用深度学习的自然语言处理模型 BERT,该研究针对社交媒体上抗疫苗言论的高峰期间,对 1506 条推文进行了分类,并可视化了其随时间变化的趋势,从而为机构制定反击抗疫苗言论的策略提供了数据支持。
Jan, 2022
使用 Transformer-based 语言模型研究尼日利亚人对疫苗的接受程度,数据分析及可视化表明,大多数推文对 COVID-19 疫苗持中立态度,个别人表示积极看法,对特定疫苗类型没有强烈偏好,尽管 Moderna 疫苗获得了稍微更多的积极情绪。同时发现,通过对适当数据集进行微调,即使预训练的 LLM 没有在特定语言上进行过预训练,也可以获得有竞争力的结果。
Jan, 2024
通过使用嵌入、深度学习模型和网格搜索算法对 Twitter COVID-19 数据集进行情感分类,本研究提出了八种不同的混合深度学习模型,旨在提高模型的整体准确性,研究表明,COVID-19 疫苗接种的公众情绪随时间逐渐改善,所提出的模型在广泛的评估中报告了 98.86% 的增加准确性,超过其他模型。
Jun, 2024
疫苗接种在社交媒体上引发了多种不同的公众意见,本研究评估了基于大型语言模型的 ChatGPT 用于情感分析,以识别人乳头瘤病毒(HPV)疫苗接种的不同立场,结果表明 ChatGPT 在分析社交媒体上的公众意见方面具有潜力,但需要在特定公共卫生背景下了解语言模型的特点和限制。
Apr, 2024
本研究通过 Deep Learning 技术和 Valent Aware Dictionary for sEntiment Reasoner 工具,对来自全球不同地区的推文进行情感分析,统计了关于 COVID-19 疫苗的社交媒体上的积极、消极和中立评论的比例,并通过 LSTM 和 Bi-LSTM 等深度学习算法验证了预测模型,为大众提供理解公众对 COVID-19 疫苗的看法的帮助。
Aug, 2022
通过手工标记方法分析南非推文中的疫苗犹豫情绪,建立 AI 分类模型,并评估其在 UGC 分类中的可靠性。在 30000 个南非推文数据集上,使用 LSTM、bi-LSTM、SVM、BERT-base-cased 和 RoBERTa-base 模型进行情感分析。其中,BERT 和 RoBERTa 模型的整体 F1 得分分别达到 60% 和 61%。采用 LDA 主题建模以改进 RoBERTa 模型的准确性。
Jul, 2023
我们的团队 “techno” 参加了 CERIST'22 共享任务,利用自然语言处理工具和 BERT 预训练语言模型,对与 COVID-19 疫情有关的 4128 个推文进行了情感分析和 8661 个推文进行了虚假新闻检测任务,并获得了情感分析任务 0.93 的准确度和虚假新闻检测任务 0.90 的准确度。
Apr, 2023