Nov, 2023

利用神经网络对社交媒体数据中的患者声音进行分类:不同数据源和治疗领域上 AI 模型的比较

TL;DR通过语言分析,本研究测试了在线患者经验信息的多样性,并结合相似性训练了分类器,以准确识别社交媒体上的患者经验帖子,称之为患者声音分类。经过实验,心血管和神经类别的分类器在 Reddit 数据源上表现最佳,F1 分数分别达到 0.865 和 1.0,而对于全部数据进行训练的 Transformer 分类器在不同治疗领域和数据源的测试数据集上,F1 分数在 0.863 到 0.995 之间。