Sep, 2022

基于预训练语言模型的冲突健康信息检测范围

TL;DR本文研究探讨在预训练语言模型中使用健康冲突检测(HCD),利用人机协作方法制造合成数据扩大已有HCD数据集的效果,并提出了难以收集现实健康冲突数据的问题以及如何使用合成数据来改善模型对于冲突特定语义的理解。在所有实验中,DeBERTa-v3的平均F1分数最高达0.68,并公开发布了超过2倍于现有数据集的HCD训练数据集。