Jun, 2024

LT4SG@SMM4H24:利用预训练语言模型对儿童健康结果进行数字流行病学推断的推文分类

TL;DR通过对英文推文中儿童医学疾病进行二分类,本文介绍了我们在 SMM4H24 共享任务 5 中的方法。第一种方法是对一个 RoBERTa-large 模型进行微调,而第二种方法则是对三个微调的 BERTweet-large 模型结果进行集成。我们证明尽管两种方法在验证数据上表现一致,但 BERTweet-large 集成模型在测试数据上表现出色。我们最佳的系统在测试数据上的 F1 分数达到了 0.938,超过了基准分类器 1.18%。