May, 2024
OpenFactCheck:面向 LLMs 的事实性评估统一框架
OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs
Yuxia Wang, Minghan Wang, Hasan Iqbal, Georgi Georgiev, Jiahui Geng...
TL;DR基于大型语言模型(LLMs)的事实性评估框架 OpenFactCheck,包括自定义自动事实检查器 CUSTCHECKER、多角度评估 LMM 事实性的统一评估框架 LLMEVAL 和使用人工标注数据集评估自动事实检查器验证结果可靠性的 CHECKEREVAL。