Nov, 2024

Ev2R:自动化事实检查中证据检索的评估

TL;DR本研究解决了现有自动化事实检查方法在证据评估中的局限性,提出了Ev2R评价框架,该框架包含三种证据评估方法:基于参考、代理参考和无参考。研究结果表明,采用大型语言模型和参考证据的提示评分方法在与人工评分的一致性和对抗性测试中表现优于传统评估方法,具有显著的影响力。