Apr, 2024

SEME 在 SemEval-2024 任务 2 中:对临床试验的自然语言推理进行屏蔽和生成式语言模型的比较

TL;DR本论文通过在临床试验报告中应用自然语言推理模型进行的一项多证据文本蕴含(NLI)任务,描述了基于微调和合并遮蔽语言模型以及使用模板的大型语言模型(如类比思维链和对比类比思维链)的两种不同方法的测试。使用辅助 Flan-T5 large 模型在 2 次迭代的情况下,实现了最佳系统,得分为 0.57 F1,0.64 忠实度和 0.56 一致性。