BriefGPT.xyz
Ask
alpha
关键词
monitor
搜索结果 - 2
评估大型语言模型知识的可靠性
本文提出了一种名为 MONITOR 的新度量方法,用于直接衡量大型语言模型的事实可靠性,通过计算有效输出与同一模型使用不同类型提示和上下文进行探索所产生的对应输出之间的概率分布距离来评估模型的一致性。实验证明 MONITOR 对于评估大型语
→
PDF
9 months ago
通过课程引导实现安全强化学习
本文提出一种受人类教学启发的替代方法,即代理在自动指导监督下学习,其中引入了监视器来防止其在学习过程中违反约束条件。
PDF
4 years ago
Prev
Next