利用大型语言模型和弱监督进行社交媒体数据标注：使用 COVID-19 自报疫苗推文进行评估

Sep, 2023

利用大型语言模型和弱监督进行社交媒体数据标注：使用 COVID-19 自报疫苗推文进行评估

Leveraging Large Language Models and Weak Supervision for Social Media data annotation: an evaluation using COVID-19 self-reported vaccination tweets

PDF

Ramya Tekumalla, Juan M. Banda

TL;DR本研究评估了使用大型语言模型（例如 GPT-4）和弱监督来识别 COVID-19 疫苗相关的推文，以与人工注释者的性能进行比较。通过手动筛选的黄金标准数据集，利用 GPT-4 在无须额外微调或指示的情况下提供标签，在单次模式下进行分析。

Abstract

The covid-19 pandemic has presented significant challenges to the healthcare industry and society as a whole. With the rapid development of covid-19 vaccines, →

covid-19 vaccine tweets social media large language models

发现论文，激发创造

利用大型语言模型进行 COVID-Tweets 的多标签分类

构建一个有效的多标签分类器，根据社交媒体帖子（尤其是推文）作者表达的特定疫苗相关担忧，对其进行标签化，比较三种不同的模型，其中 Supervised BERT-large-uncased 模型效果最佳。

Dec, 2023

分析尼日利亚网络空间中的 COVID-19 疫苗情感：基于手动标注的 Twitter 数据集的洞察

使用 Transformer-based 语言模型研究尼日利亚人对疫苗的接受程度，数据分析及可视化表明，大多数推文对 COVID-19 疫苗持中立态度，个别人表示积极看法，对特定疫苗类型没有强烈偏好，尽管 Moderna 疫苗获得了稍微更多的积极情绪。同时发现，通过对适当数据集进行微调，即使预训练的 LLM 没有在特定语言上进行过预训练，也可以获得有竞争力的结果。

Jan, 2024

使用公共社交媒体数据评估大型语言模型在健康相关文本分类任务中的性能

我们评估了多种模型，包括传统机器学习模型、预训练语言模型和大型语言模型，比较它们在社交媒体健康相关自然语言处理任务中的性能。实验结果表明，使用大型语言模型进行数据增强可以获得比仅使用人工标注数据训练的模型更好的结果，并且传统的有监督学习模型在零样本设置中也表现出优于大型语言模型的性能。

Mar, 2024

COVID-19 自动问答任务的语言模型质量评估

本文利用 GPT-2 语言模型，结合 tf-idf、BERT、BioBERT、USE 四种过滤方法，开发了一款自动回答有关 COVID-19 的聊天机器人，并通过医学专家评估，发现 BERT 和 BioBERT 优于 tf-idf 和 USE，以提供正确、即时、有用的健康数据。同时，还创建了一款用户友好型的互动网络应用程序。

Jun, 2020

大型语言模型在社交媒体上区分反疫苗和亲疫苗信息的准确性：以人类乳头瘤病毒疫苗为例

疫苗接种在社交媒体上引发了多种不同的公众意见，本研究评估了基于大型语言模型的 ChatGPT 用于情感分析，以识别人乳头瘤病毒（HPV）疫苗接种的不同立场，结果表明 ChatGPT 在分析社交媒体上的公众意见方面具有潜力，但需要在特定公共卫生背景下了解语言模型的特点和限制。

Apr, 2024

在线疫苗关注的分层多标签分类

使用大型语言模型（LLMs）在无需昂贵的训练数据集的零射击设置中检测在线话语中的疫苗关注点，分析了不同提示策略的成本和准确性权衡，结果显示 GPT-4 可以在 VaxConcerns 数据集上显著优于众包工作者准确率，获得 78.7% 的整体 F1 分数。

Feb, 2024

EdinburghNLP 在 WNUT-2020 任务 2 中的表现：利用通用数据增强和 Transformer 模型鉴别 COVID-19 推文中的信息量

本文介绍了我们提交的 WNUT-2020 任务 2 的成果：识别信息量大的 COVID-19 英文推文的半监督学习转换器集成模型，它在测试集上取得了 0.9011 的 F1 值（排名第 7），与使用 FastText 嵌入的基准系统相比表现显著提高。

Sep, 2020

基于深度学习的 Twitter 数据 COVID-19 疫苗响应情绪分析

本研究通过 Deep Learning 技术和 Valent Aware Dictionary for sEntiment Reasoner 工具，对来自全球不同地区的推文进行情感分析，统计了关于 COVID-19 疫苗的社交媒体上的积极、消极和中立评论的比例，并通过 LSTM 和 Bi-LSTM 等深度学习算法验证了预测模型，为大众提供理解公众对 COVID-19 疫苗的看法的帮助。

Aug, 2022

covLLM：针对 COVID-19 生物医学文献的大型语言模型

开发 COVID-19 文献评估工具 (covLLM) 可以帮助医生更快速地评估和提取相关信息，该工具使用大型语言模型并使用两个特定数据集（synCovid 和 real abstracts）进行训练。

Jun, 2023

COVID-19 推文中立场和前提识别的数据和模型：来自社交媒体健康挖掘 (SMM4H) 2022 共享任务的洞见

通过收集推特上有关疫苗接种的数据，以不同的主题评估模型的性能，本研究旨在支持未来在健康领域的论证挖掘研究，采用各种策略来聚合带有主张的推文文本，包括从 SMM4H 2022 排名榜中的具有特征级（早期）融合和双视图架构的模型。

Nov, 2023