Jun, 2024

FZI-WIM 在 SemEval-2024 任务 2 中的自洽 CoT 用于生物医学领域的复杂 NLI

TL;DR该研究论文描述了 FZI-WIM 在 SemEval-2024 任务 2:用于临床试验的安全生物医学自然语言推理中的推理系统。我们的系统利用思维链(CoT)范式来解决这一复杂的推理问题,并通过自洽性进一步提高了 CoT 的性能。与贪婪解码不同,我们对相同提示采样多个推理链,通过多数投票进行最终验证。这个自洽的 CoT 系统取得了 0.80(第 1 名)的基线 F1 分数,0.90(第 3 名)的忠诚度分数和 0.73(第 12 名)的一致性分数。我们公开发布代码和数据,网址见链接。