BriefGPT.xyz
大模型
Ask
alpha
关键词
reinforcement learning from knowledge feedback (rlkf)
搜索结果 - 1
学会相信自己的感受:在语言模型中利用自我意识缓解幻觉
通过使用知识探测、一致性检查和强化学习等方法,我们发现大型语言模型在辨别和表达其内部知识状态方面具有强大的自我意识,然而它们在生成过程中常常无法表达其内部知识,导致虚构。为此,我们提出了一种自动虚构注释工具,通过梦网,该工具将知识探测和一致
→
PDF
5 months ago
Prev
Next