BriefGPT.xyz
Ask
alpha
关键词
semantic graph entropy
搜索结果 - 2
SaGE:大型语言模型中的道德一致性评估
即使处于最先进状态的大型语言模型在生成对话系统方面显示出了令人印象深刻的能力,但我们展示了它们在道德一致性方面的不一致性,进而质疑它们的可靠性(以及总体的信任度)。
PDF
5 months ago
衡量大型语言模型中的道德不一致性
大型语言模型在道德场景中呈现高度不一致性,因此提出了一种新的信息熵测量方法 —— 语义图熵(SGE)。通过使用模型的决策策略解释的 “经验法则”(RoTs),我们的度量与人类判断更好地相关,并计划研究和改进 LLM 不一致性的根本原因。
PDF
5 months ago
Prev
Next