UQ 在 #SMM4H 2023 中:利用社交媒体进行公共卫生分析的 ALEX
给定研究论文,通过高级数据增强方法解决社交媒体数据不平衡问题,并借助 BERT 模型指导 LLMs,提出了一种用于公共卫生的社交媒体分析的新型 ALEX 框架,在 Social Media Mining for Health 2023 (SMM4H) 竞赛中表现优越。
Sep, 2023
基于对 LLMs 在公共卫生任务中的自动评估,将六个外部注释数据集与七个新的内部注释数据集相结合,评估 LLMs 在处理与健康负担、流行病学危险因素和公共卫生干预相关的文本中的性能,发现 Llama-3-70B-Instruct 是性能最好的模型,在 15 个任务中取得最佳结果。这些初步结果表明,LLMs 可能成为公共卫生专家从各种免费文本来源中提取信息,并支持公共卫生监测、研究和干预的有用工具。
May, 2024
使用社交媒体上用户生成的文本数据进行公共卫生监测的研究表明,使用预训练语言模型(PLM)的进展促进了针对社交媒体上公共卫生监测任务的新模型的开发。本文介绍了一种名为 PHS-BERT 的 PLM,该模型在公共卫生监测任务上的表现优于现有的 PLMs,并在广泛的数据集上表现出鲁棒性和泛化性。
Apr, 2022
我们评估了多种模型,包括传统机器学习模型、预训练语言模型和大型语言模型,比较它们在社交媒体健康相关自然语言处理任务中的性能。实验结果表明,使用大型语言模型进行数据增强可以获得比仅使用人工标注数据训练的模型更好的结果,并且传统的有监督学习模型在零样本设置中也表现出优于大型语言模型的性能。
Mar, 2024
通过随机加权干扰和对比学习策略培训语言模型,并提出元预测器以区分社交媒体文本中的非健康和健康相关类别,实验证明该策略提高了语言模型的性能,元预测器在三个基准数据集上优于现有的健康提及分类预测器。
Oct, 2023
开发了第一个用于社交媒体上的可解释性心理健康分析的开源语言模型系列 MentalLLaMA,并通过 IMHI 数据集在正确性和解释质量方面接近最先进的判别方法。
Sep, 2023
我们使用基于提示的语言模型引入了一种多步推理框架,以检测社交媒体语言模式与国家健康状况趋势之间的关系,通过基于角色的增量辅导(RBIC)这种基于提示的语言模型框架,系统提取来自反对 COVID-19 健康措施的子论坛讨论中的要点,然后跟踪这些要点在关键事件中的演变,并评估其对在线参与的影响,最后调查要点数量与疫苗接种率和住院率等国家卫生趋势的关联,我们的工作是首次将社交媒体语言模式与现实世界的公共卫生趋势相联系,突出了基于提示的语言模型在识别形成公共卫生传播策略基础上的关键在线讨论模式的潜力。
Mar, 2024
本研究探讨了利用社交媒体中个人状态和意见来研究人类健康的方法,包括数据预处理、持续预训练和优化策略,特别是对于命名实体识别任务,我们使用了名为 W2NER 的模型架构以提高模型的泛化能力。我们的方法在任务 3 中获得第一名。
Dec, 2023
本研究介绍了一种基于 BERT 的命名实体识别(NER)模型,一个深度学习规范化模块以及一个半监督聚类模块构建的框架,用于从社交媒体中提取与 COVID-19 相关的症状词典,并对其进行标准化,以减少在基于社交媒体的公共卫生研究中的关键词匹配信息检索约束。
Jun, 2023
社交媒体及其新闻推送算法对于提升构建性对话具有挑战性,本研究使用大型语言模型和基于代理模型的仿真来研究不同的新闻推送算法如何影响在线对话质量,发现新推送算法能够促进跨政治观点的建设性、非有害对话。
Oct, 2023