Feb, 2024

通过专业权重评估和减少 LLM 虚构,无需黄金标准答案

TL;DR通过权重 LLMs 的事实性评估(FEWL),我们提出了第一个专门针对没有黄金标准答案的情况的幻觉度量标准,该度量标准借助现成的 LLMs 回答充当黄金标准答案的代理,以更准确地测量幻觉,从而减少存在的威胁并提高 LLMs 的可靠性和信誉。