BriefGPT.xyz
Ask
alpha
关键词
faithfulness tests
搜索结果 - 3
概率也很重要:大型语言模型中自由文本解释的忠实度的更为准确的评估指标
评估了 Llama2 系列的少样本提示 LLMs 生成的自由文本解释在三个 NLP 任务上的忠实性,并发现我们的度量考虑了 CT 遗漏的忠实性方面。
PDF
3 months ago
关于衡量自然语言解释的可信度
大型语言模型 (LLMs) 可以通过后期或思维链 (CoT) 解释自己的预测结果,但模型可能会提供合理但不准确的解释。本文对现有的忠诚度测试进行了评估,认为这些测试实际上只测量了模型输出的自我一致性,而非其内部工作的忠诚度。作者提出了基于自
→
PDF
8 months ago
好看但缺乏忠诚:通过趋势测试理解局部解释方法
通过对传统的可解释性测试进行评估,发现在复杂数据方面存在随机优势问题。为了解决这个问题,我们提出了三种基于趋势的可信度测试,并通过实证研究证明新的趋势测试可以更好地评估图像、自然语言和安全任务的可信度。我们实施了评估系统并评估了十种常用的解
→
PDF
10 months ago
Prev
Next