Jul, 2024

GraphEval:基于知识图谱的LLM幻觉评估框架

TL;DR利用知识图谱结构进行大型语言模型(LLM)的幻觉评估,发现特定的三元组更容易产生幻觉;同时与最先进的自然语言推理模型结合使用能够提高各种幻觉基准上的平衡准确性;最后通过利用知识图谱结构进行幻觉纠正,证明大多数幻觉确实可以被矫正。