BriefGPT.xyz
Ask
alpha
关键词
self-explanations
搜索结果 - 3
忠实性与可信度:大型语言模型解释的(不)可靠性
大型语言模型的自解释性及其在高风险决策中的忠诚度与可信度之间的矛盾。
PDF
5 months ago
大型语言模型能自我解释吗?
利用自洽性检查作为一种忠实度测量,将其应用于大型语言模型自我解释的三种类型,即反事实解释、重要性度量和删除。通过不同任务和模型,发现忠实度是任务和模型相关的,例如对于情感分类,Llama2 的反事实解释、Mistral 的重要性度量和 Fa
→
PDF
6 months ago
大型语言模型能否自我解释?LLM 生成自解释的研究
ChatGPT 的自解释性能与传统方法相媲美,在成本较低的情况下,且具有许多有趣的特性,促使我们重新思考当前在 ChatGPT(类似的 LLM)时代的模型可解释性实践。
PDF
9 months ago
Prev
Next