Oct, 2021

通过结论生成评估论证的充分性

TL;DR本研究探索了使用预训练语言模型进行论点充分性评估的潜力,并发现最佳模型变量的 F1 分数为 0.885,超过了之前的最佳表现并与人类专家相当,在手动评估中发现其生成结论的质量较高,但影响力最终仍然很小。